- 11 Apr 2024
- 1 Minute to read
- Contributors
- Print
- DarkLight
- PDF
Inventorier automatiquement les renseignements personnels
- Updated on 11 Apr 2024
- 1 Minute to read
- Contributors
- Print
- DarkLight
- PDF
Extracteurs de métadonnées
Les extracteurs de métadonnées de Constellio vous permettent de détecter les informations personnelles qui sont contenues dans vos fichiers. En utilisant la puissance des expressions régulières, il est possible de chercher plusieurs formats d'information. À noter que si votre serveur Constellio est configuré avec l'OCR, la détection sera fait autant pour les documents texte que les documents image (par exemple les documents PDF numérisés).
Voici quelques exemples pour différentes informations sensibles
Titre | Expression régulière | Formats détectés |
---|---|---|
Numéro d'assurance social | \b((\d{3}[- ]\d{3}[- ]\d{3})|(\d{9}))\b | 999999999, 999 999 999, 999-999-999 |
Carte de crédit | \b((\d{4}[- ]\d{4}[- ]\d{4}[- ]\d{4})|(\d{16}))\b |
|
Numéro de téléphone | (\b[1-9][-\s]|\b)([(]\d{3}[)]|\d{3})[-\s]?\d{3}[-\s]?\d{4}\b |
|
Adresse courriel | \b[_A-Za-z0-9-\+]+(\.[_A-Za-z0-9-]+)*@[A-Za-z0-9-]+(\.[A-Za-z0-9]+)*(\.[A-Za-z]{2,})\b |
|
Vous pouvez soit simplement détecter la présence d'un renseignement personnel, soit extraire la valeur.
Voici les différents paramètres possibles
Champ | Définition | Valeurs possibles |
---|---|---|
Métadonnée | La métadonnée dans laquelle l'analyse est faite | Pour analyser le texte dans un fichier PDF, Docx, etc.; sélectionner la métadonnée Fichier |
Regex | Expression régulière pour détecter les données ciblées | *Voir les exemples plus haut |
Type | Permet de déterminer si nous voulons détecter l'information ou si nous voulons l'extraire |
|
Valeur | Détermine ce qui est écrit dans la métadonnée |
|
Pour plus d'information sur les extracteurs de métadonnées, consulter la documentation