Les snippets contextuels relèvent le niveau des pages web

Par 24 mars 2009
Mots-clés : Smart city

Créer des résumés de pages web en appliquant des techniques de contextualisation de l'information pourrait aider les internautes à mieux choisir les sites dans le flux remonté par les moteurs de recherches.

Les réponses apportées par les systèmes de recherche sur Internet manquent souvent de cohérence. Elles sont souvent trop nombreuses, particulièrement si la demande est ambiguë. D'où l'intérêt d'une méthode qui améliore la création de snippets de pages web. D'habitude, ces textes sont extraits soit des descriptifs soit du corps des pages Web indexées. Cette extraction est censée aider le demandeur à faire son choix entre tous les URL proposés par le moteur de recherche. À ce jour, la cohérence du snippet ne dépend que de règles statistiques : il est composé à partir du texte dans la page web qui est le plus cohérent vis-à-vis de la requête. Des chercheurs des universités grecques de Patras et d'Athènes ont eu l'idée d'utiliser des techniques de sémantique pour bâtir des snippets.
La sémantique au service de la précision
Après étude, ils se sont aperçus que cela donnaitdes résultats plus pertinents. Les chercheurs proposent donc de l'utiliser en sus des traditionnels outils statistiques. Leur technique se veut simple : utiliser une base sémantique comme Wordnet pour faire remonter les termes du snippet. Une méthode qui permettrait d'avoir des réponses plus précises et donc de fournir les services les plus adaptés aux internautes. Jean Christophe Combaz, président d'Outwit, explique à L'Atelier qu'à sa connaissance, "il n'existe pas d'application effective de système remplaçant l'échantillonnage statistique par une réelle optimisation sémantique".
Une solution d'avenir ?
Cette méthode est d'après lui la plus logique. Le Web sémantique "doit permettre aux machines de naviguer dans l'information afin de reconnaître progressivement les zones (pages, documents, sites, articles) à explorer de façon plus systématique" explique-t-il. Il s'interroge toutefois sur la possibilité de mettre en place un tel système au niveau des services en lignes qui reçoivent de nombreuses demandes concurrentes. "J'aurai tendance à miser sur des outils intelligents installés dans les ordinateurs des utilisateurs" précise-t-il. L'utilisation de la sémantique dans les moteurs de recherche n'est pas nouvelle, d'autres projets sont à l'étude comme Powerset ou Edelweiss de l'Inria.

Mentions légales © L’Atelier BNP Paribas