Paramètres de modification de requête

Le tableau ci-dessous détaille les paramètres de modification de requête d'un projet. Le nom, le nom de la variable, le type de la variable, la description et les valeurs par défaut sont définis pour chaque paramètre.

Remarque : Votre application de recherche Watson Explorer Engine peut nécessiter ou pas la configuration de ces paramètres. Si la description des paramètres répertoriés ici n'identifie pas clairement leur utilisation potentielle dans votre application de recherche, contactez le support IBM pour plus de précisions.
Tableau 1. Paramètres de modification de requête
Nom du paramètre Type Description

Enable wildcard expansion

(meta.wildcard-expand)

booléen

Lorsque la valeur est true, Watson Explorer Engine remplace un caractère générique d'une requête par une combinaison OR'd des mots qui correspondent au modèle de caractère générique de tous les dictionnaires utilisés par le projet. Cette option est utilisée pour prendre en charge les requêtes de caractère générique dans les moteurs de recherche qui ne prennent pas directement en charge les caractères génériques.

Valeur par défaut : false

Minimum length of wildcard term

(meta.wildcard-expand-min-length)

nombre

Lorsque l'extension de requête de caractère générique est activée, nombre minimal de caractères séquentiels requis dans un terme de requête contenant un caractère générique pour que l'extension puisse avoir lieu. Cette option permet d'améliorer la performance et aide à réduire le nombre de termes de requête générés.

Valeur par défaut : 3

Maximum expansions per word

(meta.expand-max)

nombre

Valeur par défaut : 200

Enable stem expansion

(meta.stem-expand)

booléen

Lorsque la valeur est true, Watson Explorer Engine remplace un mot avec extension de radical par une combinaison OR'd des mots ayant le même radical, en utilisant le ou les radicaux spécifiés dans la variable meta.stem_expand_stemmer.

Valeur par défaut : false

Si vous utilisez des flux de langue d'analyse lexicale, définissez la valeur sur false. Voir Flux d'analyse lexicale.

Dictionary file

(dictionary)

chaîne

Chemin du fichier dictionnaire contenant des couples #word #num, utilisé par l'expansion des caractères génériques. L'extension des radicaux utilise le nom de fichier comme racine, en ajoutant un point et la liste des radicaux. Ce dernier est alors utilisé comme nom d'un fichier de réduction au radical à rechercher et contenant des mots et des radicaux associés provenant de ce dictionnaire.

Valeur par défaut : {install-dir}/data/dictionaries/default/wildcard.dict

Stemmers for stem expansion

(meta.stem-expand-stemmer)

chaîne

Indique le ou les algorithme(s) de réduction au radical à utiliser pour l'extension de radicaux. Exécutez chico -h ou appelez vivisimo_command_usage pour afficher la liste des radicaux pris en charge. Plusieurs radicaux peuvent être combinés en ajoutant un signe + entre eux. Par exemple : dutch+french applique le radical néerlandais puis, si ce radical n'indexe pas le mot, le radical français est appliqué.

Valeur par défaut : english+depluralize

Wildcard segmenter

(meta.wildcard-segmenter)

Enum

Indique l'algorithme de l'outil de segmentation à utiliser pour l'expansion des caractères génériques. Un outil de segmentation est utilisé pour extraire un énoncé séquentiel dans des langues non segmentées (par exemple le japonais ou le chinois) et le diviser en composants (ou mots) individuels.

  • unigram : segmentation en caractères individuels
  • unigram-of-bigram : outil de segmentation qui segmente le premier caractère de chaque mot
  • bigram : segmentation en paires de mots se chevauchant
  • mixed : segmentation en unigrams de tous les caractères idéographiques. Cet outil de segmentation est recommandé pour une utilisation avec des données en chinois et des données CJK mixtes.
  • japanese : outil de segmentation pour les mots en japonais (forme conjuguée de forme de surface)
  • japanese-base : outil de segmentation pour les mots en japonais (forme de base de forme de surface)
  • japanese-reading : outil de segmentation pour les mots en japonais (forme de base de la lecture)
  • thai : outil de segmentation pour les mots en thaï

Wildcard should delanguage

(meta.wildcard-delanguage)

booléen

Tente de normaliser les signes diacritiques et les différents systèmes d'écriture avant de développer les opérateurs de caractère générique.

Valeur par défaut : false

Enable semantic expansion

(query-expansion.enabled)

booléen

La définition de cette option sur true permet d'activer l'extension automatique et manuelle de la requête d'origine avec des synonymes et d'autres termes connexes précédemment entrés dans une ontolection, le plus souvent à l'aide de Results Module Terminology Manager. Si une extension sémantique est activée, et qu'aucune valeur n'est spécifiée pour Query expansion ontolections, toutes les sources dont le nom commence par iopro-tm- sont interrogées. Pour plus d'informations, consultez la documentation en ligne.

Valeur par défaut : false

Query expansion ontolections

(query-expansion.ontolections)

chaîne

Liste des collections spéciales séparées par des espaces ou des virgules qui contiennent des équivalences de mots et d'autres relations sémantiques. Si Enable semantic expansion est défini sur true et qu'aucune valeur n'est spécifiée ici, toutes les sources dont le nom commence par iopro-tm- sont interrogées. Pour plus d'informations, consultez la documentation en ligne.

Automatic expansions

(query-expansion.automatic)

ensemble-séparé

Répertorie les libellés de relation qui sont automatiquement utilisés pour l'extension. Ces libellés de relation doivent être présents en tant que contenu dans la ou les ontolections spécifiées dans query-expansion.ontolections.

Exemples de relations :

  • synonym pour les synonymes bidirectionnels (doivent être épelés ainsi)
  • spelling pour les variations orthographiques
  • translation pour la traduction d'une seule langue, ou
  • spanish, japanese, etc. pour des traductions de langues spécifiques
  • narrower pour les termes plus restrictifs (plus spécifique que le terme de requête)
  • broader pour les termes plus larges (plus général que le terme de requête)
  • suggested pour les concepts suggérés dérivés d'une collecte de données. Pour plus d'informations, consultez la documentation en ligne.
  • alternative pour les synonymes unidirectionnels (réécritures) ; 'synonym' est réservé aux synonymes bidirectionnels
  • acronym pour les acronymes ou les abréviations du terme ou de l'expression de la requête
  • standsfor pour le terme ou l'expression qui correspond à la requête, lorsqu'il s'agit d'un acronyme ou d'une abréviation
  • related pour les autres termes connexes ou
  • isEditor, inCountry etc., pour des types spécifiques de termes connexes

Pour spécifier une promotion à appliquer à tous les termes d'extension d'un type de relation spécifique, vous pouvez ajouter un nombre compris entre 0 et 1 après un signe deux-points (par exemple, spelling:0.9|synonym:0.5). Les termes d'origine ont une promotion de 1. Utilisez des promotions inférieures à 1 pour donner moins de poids aux extensions.

Pour plus d'informations sur les différents types de relation, consultez la documentation en ligne.

Valeur par défaut : synonym:0.8|spelling:0.8|narrower:0.5

Manual expansions

(query-expansion.suggestion)

ensemble-séparé

Répertorie les libellés de relation qui doivent être affichés en tant que suggestions. Ces libellés de relation doivent être présents en tant que contenu dans la ou les ontolections spécifiées dans query-expansion.ontolections.

Exemples de relations :

  • synonym pour les synonymes bidirectionnels (doivent être épelés ainsi)
  • spelling pour les variations orthographiques
  • translation pour la traduction d'une seule langue, ou
  • spanish, japanese, etc. pour des traductions de langues spécifiques
  • narrower pour les termes plus restrictifs (plus spécifique que le terme de requête)
  • broader pour les termes plus larges (plus général que le terme de requête)
  • suggested pour les concepts suggérés dérivés d'une collecte de données. Pour plus d'informations, consultez la documentation en ligne.
  • alternative pour les synonymes unidirectionnels (réécritures) ; 'synonym' est réservé aux synonymes bidirectionnels
  • acronym pour les acronymes ou les abréviations du terme ou de l'expression de la requête
  • standsfor pour le terme ou l'expression qui correspond à la requête, lorsqu'il s'agit d'un acronyme ou d'une abréviation
  • related pour les autres termes connexes ou
  • isEditor, inCountry etc., pour des types spécifiques de termes connexes

Pour spécifier une promotion à appliquer à tous les termes d'extension d'un type de relation spécifique, vous pouvez ajouter un nombre compris entre 0 et 1 après un signe deux-points (par exemple, translation:0.9|spanish:0.4). Les termes d'origine ont une promotion de 1. Utilisez des promotions inférieures à 1 pour donner moins de poids aux extensions.

Pour plus d'informations sur les différents types de relation, consultez la documentation en ligne.

Valeur par défaut : translation:0.5|broader:0.3|related:0.2

Enable stemming of the expanded query

(query-expansion.stem-expansions)

booléen

Définissez cette option sur true pour ajouter des variations de réduction au radical pour tous les termes présents dans la requête étendue.

Sauf indication contraire dans l'affichage Query Expansion, les extensions de réduction au radical des termes d'origine apparaissent sous Stemming, et les extensions de réduction au radical des extensions sémantiques (synonymes, termes plus restrictifs, etc.) sous ce type de relation plus -stemming (par exemple, Synonym+stemming).

Valeur par défaut : false

Stemming expansions weight

(query-expansion.stemming-weight)

nombre

Les termes d'origine ont par défaut une valeur de poids de 1. Vous pouvez modifier le classement des documents contenant des variations de réduction au radical en modifiant ce nombre. Plus ce nombre est élevé, plus les documents avec des variations de réduction au radical apparaîtront dans la liste des résultats.

Valeur par défaut : 0,5

Stemming dictionary for semantic expansions

(query-expansion.stemming-dictionary)

chaîne

Dictionnaire de réduction au radical permettant de générer des extensions de radicaux pour la requête étendue sémantiquement.

Valeur par défaut : english/wildcard.dict

Max expansions

(query-expansion.max-terms-per-type)

nombre

Nombre maximal d'extensions pour chaque terme/expression dans la requête d'origine et pour chaque type de relation spécifié dans les types d'extension automatique et manuelle. La valeur -1 indique un nombre illimité d'extensions.

Valeur par défaut : 5

Query expansion match type

(query-expansion.query-match-type)

Enum

Type de correspondance de requête. 'terms' correspond à tous les termes et expressions explicites dans une ontolection, 'exact' correspond à l'intégralité de la requête dans une ontolection, 'exact-terms' correspond à l'intégralité de la requête ainsi qu'aux termes individuels lorsque la requête comporte plusieurs termes et qu'aucun guillemet n'est utilisé, 'all-subphrases' correspond à toutes les sous-chaînes contiguës dans une ontolection, 'exact', 'exact-terms' et 'all-subphrases' sont uniquement pris en charge pour les requêtes simples sans opérateur.

Valeur par défaut : exact-terms

Data-driven conceptual search correlation metric

(query-expansion.conceptual-search-metric)

Enum

Indicateur de corrélation permettant de comparer des termes de requête avec des candidats de suggestion stockés dans une ontolection cs-ontolection. 'dice' désigne le coefficient dé, qui calcule le nombre de dimensions dans lesquelles les deux vecteurs sont différents de zéro et qui normalise la longueur. La valeur 'euclidean dot product' prend les promotions en compte.

Valeur par défaut : euclidean-dot-product

Data-driven conceptual search similarity threshold

(query-expansion.conceptual-search-similarity-threshold)

nombre

Seuil de similitude utilisé pour filtrer les candidats de suggestion stockés dans une ontolection cs-ontolection. Plus ce nombre est élevé, plus les candidats de suggestion doivent être similaires dans le terme de requête, et donc moins nombreuses et de meilleure qualité seront les suggestions. Pour commencer, nous conseillons de définir cette valeur sur 0,5 si vous utilisez euclidean-dot-product comme mesure et sur 0,2 si vous utilisez dice comme mesure ci-dessus.

Pour plus d'informations, consultez la documentation en ligne.

Valeur par défaut : 0,5