Extracteurs de métadonnées
  • 12 Jul 2022
  • 5 Minutes à lire
  • Contributeurs
  • Sombre
    Clair
  • PDF

Extracteurs de métadonnées

  • Sombre
    Clair
  • PDF

Article Summary

1. Les extracteurs de métadonnées

Permets de faire l'ajout d'éléments dans Constellio et d'extraire leurs métadonnées, soit par l'utilisation des styles, des extractions régulières ou des propriétés. L'ordre de priorité pour le peuplement d'une métadonnée est défini dans les configurations du système. Si aucune donnée n'est définie pour les styles et les expressions régulières par l'extracteur de métadonnées, Constellio exportera automatiquement les données des propriétés. 

Voici la fiche à remplir pour définir des styles, des propriétés et des expressions régulières pour une métadonnée précise : 

Il est utile, pour une métadonnée précise, d'indiquer des informations d'extraction selon les trois méthodes (styles, propriétés et expressions régulières). Toutefois, pour un modèle Word précis avec des styles, il peut également être utile de créer un schéma de métadonnées propres à ce modèle et de définir précisément comment extraire chaque métadonnée avec un ou plusieurs styles ou modèle Word.


POINTS DE VIGILANCE
Si aucune donnée n'est définie pour les styles et les expressions régulières par l'extracteur de métadonnées, Constellio exportera automatiquement les données des propriétés.
Informations supplémentaires - Utilisation de modèle word
Il est utile, pour une métadonnée précise, d'indiquer des informations d'extractions selon les trois méthodes (styles, propriétés et expressions régulières). Toutefois, pour un modèle Word précis avec des styles, il peut également être utile de créer un schéma de métadonnées propres à ce modèle et de définir précisément comment extraire chaque métadonnée avec un ou plusieurs styles du modèle Word.

2. Créer un extracteur de métadonnée

  1. Cliquer sur « Pilotage » dans le menu de navigation;
  2. Cliquer sur « Extracteur de métadonnée »;
  3. Dans la fenêtre « Extracteur de métadonnée », cliquer sur « Ajouter »;
  4. Dans la deuxième fenêtre « Extracteur de métadonnée », compléter les métadonnées nécessaires à la création d'un extracteur de métadonnée. Que ce soit avec les styles, les propriétés, les expressions régulières ou seulement les éléments désirés. Cliquer sur « Enregistrer ». 
Volet 1 : sélection de la métadonnée
Nom du champTypeDescription
Type de schémaObligatoireSélectionner un type de schéma.
SchémaObligatoireSi plusieurs schémas existent pour le type de schéma sélectionné, choisir le schéma précis qui contient la métadonnée pour laquelle l'extracteur doit être créé. 
MétadonnéeObligatoireSélectionner la métadonnée précise (ex. : titre, auteur, description, etc.)
Volet 2 : définir les styles, propriétés et expressions régulières
Nom du champTypeDescription
StylesFacultatifInscrire le nom donné au style dans Word. Le nom doit être écrit un minuscule et sans espace. (Ex. : si le style est nommé Titre propre, il faut écrire titrepropre).
Il est possible d'inscrire plusieurs styles pour une métadonnée. 
PropriétésFacultatifInscrire le nom de la propriété qui équivaut à la métadonnée. Pour les schémas, document et courriel, les propriétés qui équivalent aux métadonnées sont déjà indiquées par défaut dans l'extracteur de métadonnées. Si vous ajoutez un nouveau schéma, il est possible de vous fier à celles indiquées pour le document. 
Regexes (expressions régulières)

Facultatif
Permets de définir une ou plusieurs expressions régulières, chacune visant une métadonnée précise. Pour chaque expression régulière, lorsque la métadonnée visée correspond, il est possible de configurer l'extracteur pour qu'il utilise la valeur trouvée, ou une autre valeur qu'on précise. 
MétadonnéePermets de la métadonnée, source.
RegexPermets d'inscrire l'expression régulière.
TypePermets d'indiquer s'il s'agit d'une substitution ou d'une transformation.
ValeurPermets d'inscrire la nouvelle valeur. 
Activé seulement à la créationFacultatifPermet d'indiquer si l'extraction se fait seulement à la création du document, ou à chaque fois qu'il est modifié.

2.1 Analyseur de propriétés

L'analyseur de propriétés permet de sélectionner le document de votre choix pour analyser ses propriétés et y choisir la métadonnée que vous voulez extraire automatiquement.

  1. Cliquer sur «Pilotage» dans le menu de navigation;
  2. Cliquer sur «Extracteur de métadonnée»;
  3. Dans la fenêtre «Extracteur de métadonnée», cliquer sur «Ajouter»;
     
  4. Cliquer sur l'option «Analyseur de propriétés»;
  5. Sélectionner par le bouton un document ou glisser celui-ci dans la page;
  6. Les métadonnées de propriétés et de styles sont affichées, cliquer sur la métadonnée de votre choix;
  7. Une confirmation que la propriété a été ajoutée à la liste apparait;
  8. Fermer la fenêtre pour revenir à la page d'extraction de métadonnées. La métadonnée «Page Count» a été ajoutée à la métadonnée «Page-Count».
  9. Vous devez maintenant remplir les autres champs pour déterminer dans quelle métadonnée déjà existante «Page Count» doit s'extraire.
  10.  La métadonnée est maintenant définie comme une métadonnée extraite. 
  11. La métadonnée est maintenant extraite automatiquement dès l'ajout dans Constellio.
Métadonnées
Vous devez avoir préalablement créé votre métadonnée à laquelle relier l'extraction. Pour en savoir plus sur la création de métadonnées, consultez la page «Ajouter une métadonnée».

3. Modifier un extracteur de métadonnées

  1. Cliquer sur « Pilotage » dans le menu de navigation;
  2. Cliquer sur « Extracteur de métadonnée »;
     
  3. Dans la fenêtre « Extracteur de métadonnée », cliquer sur le calepin à droite de l'élément à modifier;
  4. Apporter les modifications et cliquer sur « Enregistrer ».

4. Supprimer un extracteur de métadonnées

  1. Cliquer sur « Pilotage » dans le menu de navigation;
  2. Cliquer sur « Extracteur de métadonnée »;
     
  3. Dans la fenêtre « Extracteur de métadonnée », cliquer sur le X rouge à droite de l'élément à supprimer;
  4. Une fenêtre de confirmation apparaît, cliquer sur « Enregistrer ».

CONFIGURATIONS RELIÉES À LA FONCTIONNALITÉ
ConfigurationDescriptionValeurs possiblesImpacts
Priorité lors du peuplement des métadonnéesLorsque l'on importe des documents et que nous désirons faire l'extraction automatique du titre, il faut spécifier ici l'ordre de priorisation pour le peuplement de la métadonnée.Styles : Pour un document Word sera importé et prit en compte en priorité le style que l'on a créé dans le document Word. Exemple : Pour le choix Styles -> Expressions réguliers -> Propriétés, Constellio fera l'extraction dans l'ordre suivant si les données sont disponibles :
  • Styles 
  • Expressions régulières
  • Propriétés

S'il n'y a aucune donnée dans les styles et expressions régulières, Constellio exportera automatiquement les données des propriétés.

Priorité lors du peuplement du titreLorsque l'on importe des documents et que nous désirons faire l'extraction automatique du titre, il faut spécifier ici l'ordre dans lequel sera importée la métadonnée titre. Pour cela, il faut paramétrer le module d'extracteurs de métadonnées. Styles : Pour un document Word sera importé et prit en compte en priorité le style que l'on a créé dans le document Word.Exemple : Pour le choix Styles -> Expressions réguliers -> Propriétés, Constellio fera l'extraction dans l'ordre suivant si les données sont disponibles :
  • Styles
  • Nom du fichier
  • Propriétés

S'il n'y a aucune donnée dans les styles et expressions régulières, Constellio exportera automatiquement les données des propriétés. 

Nom du fichier : Le nom du fichier sera utilisé.
Propriétés : Le titre défini dans les propriétés sera utilisé. 



Cet article vous a-t-il été utile ?

Changing your password will log you out immediately. Use the new password to log back in.
First name must have atleast 2 characters. Numbers and special characters are not allowed.
Last name must have atleast 1 characters. Numbers and special characters are not allowed.
Enter a valid email
Enter a valid password
Your profile has been successfully updated.