Presidio de Microsoft en Open source.
Installation de PRESIDIO sur DOCKER
Description
This document describes the installation of the entire Presidio suite using pip (as Python packages) or using Docker (As containerized services).
Using pip
Supported Python Versions
Presidio is supported for the following python versions:
- 3.10
- 3.11
- 3.12
- 3.13
PII anonymization on text
For PII anonymization on text, install the presidio-analyzer and presidio-anonymizer packages with at least one NLP engine (spaCy, transformers or stanza):
pip install presidio_analyzer
pip install presidio_anonymizer
python -m spacy download en_core_web_lg
GPU acceleration (optional)
For GPU acceleration, install the appropriate dependencies for your hardware:
- Linux with NVIDIA GPU:
pip install "spacy[cuda12x]"(or the version matching your CUDA installation) - macOS with Apple Silicon: MPS is detected automatically, no additional dependencies required.
For detailed GPU setup, verification, and troubleshooting, see GPU Acceleration.
PII redaction in images
For PII redaction in images
Install the
presidio-image-redactorpackage:pip install presidio_image_redactor # Presidio image redactor uses the presidio-analyzer # which requires a spaCy language model: python -m spacy download en_core_web_lgInstall an OCR engine. The default version uses the Tesseract OCR Engine. More information on installation can be found here.
Utilisation de Docker
Presidio peut exposer les terminaux REST pour chaque service en utilisant Flask et Docker. Pour télécharger les conteneurs Presidio Docker, exécutez la commande suivante :
Note
Cela nécessite l’installation de Docker. Téléchargez Docker.
Pour l’anonymisation des PII dans le texte
Pour la détection des PII et l’anonymisation dans le texte, les modules et sont requis.presidio-analyzerpresidio-anonymizer
# Download Docker images
docker pull mcr.microsoft.com/presidio-analyzer
docker pull mcr.microsoft.com/presidio-anonymizer
# Run containers with default ports
docker run -d -p 5002:3000 mcr.microsoft.com/presidio-analyzer:latest
docker run -d -p 5001:3000 mcr.microsoft.com/presidio-anonymizer:latest
Pour la rédaction des PII dans les images
Pour la détection de PII dans les images, le est requis.presidio-image-redactor
# Download Docker image
docker pull mcr.microsoft.com/presidio-image-redactor
# Run container with the default port
docker run -d -p 5003:3000 mcr.microsoft.com/presidio-image-redactor:latest
Une fois les services en cours, leurs API sont disponibles. Des références API et des appels d’exemples sont disponibles ici.
Installer depuis la source
Pour installer Presidio depuis le source, clonez d’abord le dépôt :
- utilisant HTTPS
git clone https://github.com/microsoft/presidio.git
- Utilisation du SSH
git clone git@github.com:microsoft/presidio.git
Ensuite, construis les conteneurs localement.
Note
Presidio utilise docker-compose pour gérer les différents conteneurs Presidio.
Depuis le dossier racine du dépôt :
docker-compose up --build
Sinon, vous pouvez construire et gérer des services individuels. Par exemple, pour le service :presidio-anonymizer
docker build ./presidio-anonymizer -t presidio/presidio-anonymizer
Et courez :
docker run -d -p 5001:5001 presidio/presidio-anonymizer
Pour plus d’informations sur le développement local, Consultez la section Mise en place d’un environnement de développement.