Aller au contenu
Expansion de requêtes pour l’optimisation de la recherche d’information multilingue basée sur la traduction des contenus
Benoît Gaillard, Jean-Léon Bouraoui, Emilie Guimier de Neef, Malek Boualem
Orange Labs
2 avenue Pierre Marzin
22300 Lannion cedex, France
CORIA 2010
Résumé de l’article :
L’Expansion des Requêtes cherche et propose des termes “voisins” à ajouter à la requête initiale. Dans le module d’ER, les termes voisins sont sélectionnés sur la base de la proximité sémantique, lexicale et/ou morphologique, selon 5 modes: flexion, synonymes, hyperonymes, termes dérivés, expansion géographique. Ces modes sont basés sur le thésaurus mentionné dans l’article et sur la base de données Geonames (www.geonames.org). De cette sélection résulte une liste de termes ordonnée par ordre décroissant de proximité avec le sens de la requête initiale. Nous sélectionnons dans cette liste les 20 premiers termes qui font partie du vocabulaire des contenus traduits. Ainsi, l’ER est adaptée à l’index des contenus traduits. Notre système se présente donc sous la forme de deux modules complémentaires annexés à un moteur de recherche monolingue: en front office, un module d’Expansion des Requêtes ciblée et en back office un module de TA de données.