- 12 Jul 2022
- 9 Minutes à lire
- Contributeurs
- Impression
- SombreClair
- PDF
iO Recherche évoluée
- Mis à jour le 12 Jul 2022
- 9 Minutes à lire
- Contributeurs
- Impression
- SombreClair
- PDF
1. Recherche évoluée
La fonctionné de recherche évoluée propose une série de fonctionnalités destinées à optimiser la recherche dans Constellio. Les fonctions suivantes sont rendues disponibles par ce module :
- Statistiques
- Boost de la recherche par métadonnée
- Boost de la recherche par requête
- Learning to rank
- Gérer les facettes
- Capsules de recherche
- Mots exclus du correcteur
- Configuration du thésaurus
- Gestion des synonymes
- Gestion de l'élévation et de l'exclusion
- Contextes de recherche
2. Capsule de recherche
Les capsules sont un outil destiné à présenter de l'information complémentaire à une recherche. Une capsule peut être personnalisée. Elle est affichée lorsque les termes de recherche de l'utilisateur correspondent aux critères de la capsule.
2.1 Consulter les capsules
Pour consulter les capsules :
- Aller dans « Pilotage »;
- Puis dans « Configuration de la recherche »;
- Cliquer sur « Capsules de recherche ».
2.2 Ajouter les capsules
- Aller dans « Pilotage »;
- Puis dans « Configuration de la recherche »;
- Cliquer sur « Capsules de recherche »;
- Cliquer sur « Ajouter une capsule »;
- Cliquer sur « Enregistrer » pour sauvegarder votre capsule.
Métadonnées d'ajout de capsules | |
---|---|
Nom du champs | Description |
Code | Identifiant interne pour votre capsule. |
Titre | Titre affiché pour les utilisateurs. |
Mots-clés | Termes de recherche qui vont déclencher l'affichage de la capsule. |
Langue | Pour quelles langues l'affichage sera effectué. |
Sous-collection | (Avancé) Filtrer pour l'affiche de la capsule basée sur la métadonnée sous collection. |
Contenu (texte) | Contenu affiché pour la capsule. |
Contenu (fichiers) | Images pour être utilisées dans l'affiche de capsule. Utiliser le clic droit après le téléversement pour récupérer le lien de l'image. |
2.3 Affichage
Voici un exemple d'affichage d'une capsule :
3. Configuration du thésaurus
Constellio permet d'intégrer un thésaurus dans le format SKOS afin d'ajouter des fonctionnalités au niveau de la recherche pour les utilisateurs. Voici les fonctionnalités :
- Autocomplétion dans le champ de recherche
- Proposer des recherches reliées
- Associer des domaines aux recherches
Le thésaurus est stocké dans le format SKOS.
3.1 Prérequis
Vous devez disposer d'un thésaurus existant dans le format SKOS. Constellio ne garantit pas un support complet au format SKOS, il est donc important de valider la compatibilité avec notre produit.
3.2 Configuration
- Dans Pilotage, aller dans « Configuration de la recherche »;
- Puis cliquer sur « Gestion du thésaurus ».
L'écran est divisé en trois onglets :
- Fichier SKOS, indique le fichier chargé et permet d'en téléverser un nouveau.
- Termes refusés : indique les termes à ignorer dans le thésaurus téléversé.
- Statistiques : permets de récupérer des statistiques pour l'indexation du thésaurus.
3.2.1 Fichier SKOS
Cet écran liste le thésaurus actuellement chargé, si l'un des champs de description suivants est rempli :
- À propos
- Thésaurus
- Description
- Date
- Créateur
Ces informations sont extraites du fichier SKOS actuellement chargé (ou non). Vous avez l'option de télécharger une copie avec le bouton Téléchargement. Vous pouvez vider le thésaurus chargé avec le bon « Supprimer le fichier SKOS enregistré ». Le champs fichier permet de glisser / déposer un fichier ou de sélectionner le fichier en cliquant sur « Choisir un fichier ». Une fois un nouveau SKOS téléversé, il est important de cliquer sur « Enregistrer ».
3.2.2 Termes refusés
Entrer les termes à ignorer du thésaurus. Un terme par ligne. Cliquer sur « Enregistrer », pour appliquer les changements.
3.2.3 Statistiques
Constellio offre une série de statistiques pour l'utilisation du thésaurus.
- Nombre de documents avec au moins un concept du thésaurus.
- Nombre de concepts utilisés au moins une fois.
- Nombre de documents sans concept du thésaurus.
- Les 1000 concepts les plus utilisés : télécharger le fichier Excel pour consulter.
- Les concepts non utilisés : télécharger les fichiers Excel pour consulter.
4. Contextes de recherche
Les contextes de recherche sont utilisés pour personnaliser l'affichage des résultats de recherche. Ils permettent de générer une présentation HTML sur mesure pour l'affichage des résultats.
Cette approche d'intégration n'est plus recommandée pour les nouveaux déploiements. L'intégration par client Javascript est beaucoup plus flexible. Toutefois, pour des besoins patrimoniaux, cette fonctionnalité a été intégrée à Constellio.
4.1 Prérequis
Une base de données supplémentaire doit être installée à Constellio pour permettre cette fonctionnalité.
4.2 Configuration
- Pour confirmer les contextes, aller dans « Pilotage »;
- Puis dans « Configuration de la recherche »;
- Cliquer sur « Contexte de recherche ». La liste des contextes est affichée;
- Pour ajouter un contexte, cliquer sur le bouton « Ajouter ».
Propriétés pour les contextes | |
---|---|
Noms du champs | Description |
Nom du contexte | Pour affichage. |
Valeur du paramètre url | URL utilisé pour sélectionner le contexte (doit être unique). |
Fichiers externes | Permettre d'ajouter des fichiers externes au contexte. |
Nom de la collection | Si le contexte doit être affiché pour une seule collection. |
HTML de l'entête (français) | Le contenu (français) est ajouté directement dans l'entête de la page HTML, au début du <body>. |
HTML de l'entête (anglais) | Le contenu (anglais) est ajouté directement dans l'entête de la page HTML, au début du <body>. |
HTML du pied de page (français) | Le contenu (français) est ajouté directement à la fin de la page HTML. |
HTML du pied de page (anglais) | Le contenu (anglais) est ajouté directement à la in de la page HTML. |
HTML du tag HEAD (français) | Le contenu (français) est ajouté directement dans la base <head> de la page. |
HTML du tag HEAD (anglais) | Le contenu (anglais) est ajouté directement dans la base <head> de la page. |
Pour un contexte, on peut aussi ajouter des paramètres, avec le bouton « Paramètre ». Les paramètres sont ajoutés pour chaque contexte. Ils peuvent être hérités pour les sous-contextes.
Valeurs d'un contexte | |
---|---|
Noms de la valeur | Description |
Nom du paramètre | Identifiant avec lequel on peut référencer la valeur. Le standard est d'utiliser la syntaxe ###Nom###. |
Type |
|
Contenu | Selon le type indiqué plus haut. |
5. Gestion de l'élévation et de l'exclusion
L'élévation permet deux fonctions :
- Placer un résultat de recherche en haut complètement pour une recherche précise.
- Exclue un résultat de recherche pour toutes les recherches.
Un écran de configuration permet de gérer les documents élevés ou exclus du moteur de recherche.
5.1 Configuration
5.1.1 Ajout
Il est possible d'élever un résultat directement à partir du lien du résultat dans le moteur de recherche.
- Pour exclure le résultat de toutes les recherches (pour tous les utilisateurs), cliquer sur « Exclure ».
- Pour élever un résultat pour les termes de recherche entrés. Cliquer sur « Élever ».
5.1.2 Retrait
Pour retirer une élévation ou une exclusion, allez dans Pilotage -> Configuration de la recherche -> Gestion de l'élévation et de l'exclusion.
Le tableau est divisé en deux sections :
- Pour la liste des élévations. Cliquer sur le « X » pour retirer.
- Pour la liste des exclusions. Cliquer sur le « X » pour retirer.
6. Gestion des synonymes
Les synonymes permettent de fournir un (ou plusieurs) terme équivalent lors d'une recherche. Par exemple, si on recherche « dollar », on peut permettre de retrouver les documents avec les termes « dollars » ou « dolar ».
6.1 Configuration
Pour configurer la liste des synonymes, aller dans Pilotage -> Configuration de la recherche -> Gestion des synonymes. Cliquer sur le bouton « Modifier ».
Les synonymes doivent être entrés et séparés par des virgules. Chaque groupe de synonymes est séparé par une ligne.
Exemple :
dollars,dollar,dolar
constellio,costellio
Les synonymes ne sont pas sensibles aux accents, mais pas à la case.
7. Learning to rank (expert)
Ce module permet à Constellio d'apprendre à fournir de meilleurs résultats en fonction des recherches passées. Il est basé sur modèle d'apprentissage machine reclassant les résultats.
Ce module travaille à 3 niveaux :
- Description de « feature », un feature représente un critère qui sera pondéré.
- Entrainement : à partir des « features » choisis et des recherches passées, un modèle est construits.
- Modèle : un modèle indique le pointage de la recherche.
Le processus doit être effectué en boucle, afin de raffiner le modèle basé sur le résultat de recherche passée.
7.1 Ajout d'un feature
Cliquer sur le bouton « Ajouter » sur la droite. Voici l'écran d'ajout / modification :
Le nom permet de décrire le feature, par exemple « pdf ».
Le type de requête.
q : pour un feature qui dépend de la requête. Le feature détermine le score du document en fonction de sa correspondance à la requête Solr indiquée.
fq : pour un feature qui ne dépend pas de la requête. Le feature détermine une valeur 1 / 0 selon la correspondance au filtre Solr indiqué.
La valeur de la requête est basée sur la requête interne envoyée par Constellio à Solr.
7.2 Entraînement
Une fois les features définis, on peut effectuer la construction d'un modèle. Constellio journalise les requêtes et les calculs de features associés.
On peut ainsi utiliser différentes techniques pour générer un modèle qui sera ajouté à Solr.
Actuellement ce processus doit être effectué par programmation à l'extérieur de Constellio.
8. Mots exclus du correcteur
Le correcteur orthographique de Constellio propose des corrections de termes entrés par l'utilisateur basé sur le contenu de l'index et/ou des recherches passées. Voici un exemple du correcteur en action.
8.1 Prérequis
Pour permettre de retirer les suggestions, l'utilisateur doit avoir un rôle offrant la fonction « Gérer les suggestions du correcteur ».
8.2 Configuration des mots-clés
Dans l'exemple plus haut, pour retirer le mot « archive », il suffit de cliquer sur le « X » après le mot-clé à retirer. Confirmer la suppression.
Le mot-clé sera ajouté dans une liste d'exclusion disponible dans Pilotage -> Configuration de la recherche -> Mot exclu du correcteur.
Voici un exemple :
Pour rendre le mot de nouveau disponible dans le correcteur, cliquer sur la flèche verte à droite.
9. Statistiques
Le module de statistiques de Constellio permet de consulter les recherches effectuées par les utilisateurs. Différents rapports sont disponibles pour consulter l'information.
9.1 Types de rapports
Voici les types de rapports disponibles pour consulter les statistiques de recherche.
Types de rapports disponibles | |
---|---|
Nom du rapport | Description |
Journal des requêtes | Rapport complet de toutes les recherches effectuées. |
Les requêtes les plus populaires | Regroupe les recherches et effectuent un décompte tri par les plus populaires. |
Les requêtes les plus populaires sans résultat | Regroupe les recherches sans aucun résultat et effectuent un décompte trié par les plus populaires. |
Les requêtes les plus populaires avec clic de souris | Regroupe les recherches pour lesquelles un résultat a été cliqué et effectue un décompte trié par les plus populaires. |
Les requêtes les plus populaires sans clic de souris | Regroupe les recherches pour lesquelles aucun résultat n'a été cliqué et n’effectue un décompte trié par les plus populaires. |
9.2 Configuration des rapports
Voici une description des champs disponibles pour la configuration des rapports.
Cliquer sur « Appliquer » pour générer un nouveau rapport selon les paramètres entrés.
Nom du champs | Description |
Requêtes exclues | Permet de filtrer certaines requêtes des rapports générés. |
Types de statistiques | Voir le tableau plus haut. |
Date de départ / fin | Période pour la génération du rapport. |
Filtrer | (Avancé) Filtre selon le contenu des paramètres de la recherche. |
Capsule | Permet de filtrer les recherches selon les capsules affichées. |
Afficher la colonne paramètre | (Avancé) Montre la requête interne de Constellio, peut être utilisé pour des filtrages avancés (avec le champ Filtré). |
Lignes | Nombre de lignes pour la génération du fichier Excel. |
9.3 Champs affichés
Voici une description des champs affichés dans les rapports.
Nom du champs | Description |
Date | Date / heure (sur le serveur) au moment de la recherche. |
Requête | Teste entré par l'utilisateur. |
Fréquence | (Pour tous les rapports de types les plus populaires) décompte pour la requête. |
Sous collection | (Avancé) Indique si la recherche correspond à un filtrage basé sur une sous collection (champs de métadonnée). |
Langue | Langue de la recherche (basé sur un critère ou le profil de l'utilisateur). |
Nombre de résultats trouvés | Nombre de résultats totaux |
Nombre de résultats cliqués | Nombre de liens cliqués dans les résultats affichés. |
Durée | Temps en ms pour le traitement de la recherche. |
Page | Page affichée lors de la recherche. |
Type de recherche | Si c'est une recherche (Au moins un des mots, Expression exacte, etc.) |
Capsule | Code des capsules affichées lors de la recherche. |
Résultats cliqués | Nombre de résultats cliqués. |
Paramètres | Détails interne de la recherche. |