Inventorier automatiquement les renseignements personnels
  • 11 Apr 2024
  • 1 Minute to read
  • Contributors
  • Dark
    Light
  • PDF

Inventorier automatiquement les renseignements personnels

  • Dark
    Light
  • PDF

The content is currently unavailable in English. You are viewing the default French version.
Article summary

Extracteurs de métadonnées

Les extracteurs de métadonnées de Constellio vous permettent de détecter les informations personnelles qui sont contenues dans vos fichiers. En utilisant la puissance des expressions régulières, il est possible de chercher plusieurs formats d'information. À noter que si votre serveur Constellio est configuré avec l'OCR, la détection sera fait autant pour les documents texte que les documents image (par exemple les documents PDF numérisés).


Voici quelques exemples pour différentes informations sensibles

TitreExpression régulièreFormats détectés
Numéro d'assurance social\b((\d{3}[- ]\d{3}[- ]\d{3})|(\d{9}))\b999999999, 999 999 999, 999-999-999
Carte de crédit\b((\d{4}[- ]\d{4}[- ]\d{4}[- ]\d{4})|(\d{16}))\b
  • 9999999999999999
  • 9999 9999 9999 9999
  • 9999-9999-9999-9999
Numéro de téléphone(\b[1-9][-\s]|\b)([(]\d{3}[)]|\d{3})[-\s]?\d{3}[-\s]?\d{4}\b
  • 9 (999) 999-9999
  • (999) 999-9999
  • 999-999-9999
  • 999 999 9999
  • 9-999-999-9999
  • 9 999 999 9999
Adresse courriel\b[_A-Za-z0-9-\+]+(\.[_A-Za-z0-9-]+)*@[A-Za-z0-9-]+(\.[A-Za-z0-9]+)*(\.[A-Za-z]{2,})\b
  • XXXXXXXXXXX@XXXXX.XXX
  • XXXXXXXXXXX@XXXXX.XXX.XXX


Exemple de configuration d'un extracteur pour détecter la présence d'une carte de crédit


Vous pouvez soit simplement détecter la présence d'un renseignement personnel, soit extraire la valeur.

Voici les différents paramètres possibles

 

ChampDéfinitionValeurs possibles
MétadonnéeLa métadonnée dans laquelle l'analyse est faitePour analyser le texte dans un fichier PDF, Docx, etc.; sélectionner la métadonnée Fichier
RegexExpression régulière pour détecter les données ciblées*Voir les exemples plus haut
TypePermet de déterminer si nous voulons détecter l'information ou si nous voulons l'extraire
  • Substitution: Si le renseignement est détecté, écrire dans la métadonnée une valeur prédéfinie, par exemple "Contient un numéro d'assurance social"
  • Transformation: Si le renseignement est détecté, extraire la valeur dans la métadonnée
ValeurDétermine ce qui est écrit dans la métadonnée
  • Substitution: Saisir une valeur prédéfinie comme "Contient un numéro d'assurance social"
  • Transformation: La valeur écrite est la position de la valeur détectée. Par exemple, si le texte détecte 3 fois une carte de crédit, écrire
    • $0 pour la première correspondance
    • $1 pour la deuxième correspondance
    • $2 pour la troisième correspondance

 Pour plus d'information sur les extracteurs de métadonnées, consulter la documentation






Was this article helpful?

Changing your password will log you out immediately. Use the new password to log back in.
First name must have atleast 2 characters. Numbers and special characters are not allowed.
Last name must have atleast 1 characters. Numbers and special characters are not allowed.
Enter a valid email
Enter a valid password
Your profile has been successfully updated.