Les tweets aussi peuvent s'annoter automatiquement

Par 18 juin 2010 1 commentaire
Mots-clés : Smart city

L'université de Pisa propose un système qui établit des liens entre les termes d'un texte court diffusé sur Internet et des pages Wikipedia.

Pour enrichir le contenu des résultats des moteurs de recherche et des flux diffusés sur les sites de micro-blogging tel que Twitter, deux chercheurs de l'université italienne de Pisa proposent d'utiliser un système d'annotation en temps réel. Ils ont mis au point un logiciel, baptisé "Tagme", qui établit des liens entre un texte court et des pages de l'encyclopédie en ligne Wikipedia. D'autres systèmes préexistants parvenaient déjà à dresser des passerelles, en effectuant une analyse sémantique rapide, et en renvoyant ensuite vers des pages encyclopédiques en rapport avec les résultats obtenus. En l'occurrence, le programme développé par les scientifiques vise à étendre ces travaux à des textes particulièrement succincts, et sans cesse réactualisés.
Des textes également moins structurés
Ce qui impose une prise en compte rapide des textes analysés et, du coup, des modifications dans les algorithmes utilisés. Afin de permettre une annotation automatique pertinente, pour des textes qui sont également moins structurés. Le système logiciel commence par repérer certains termes clés du court texte analysé, et effectue une recherche polysémique pour fournir les pages Wikipedia les plus appropriées. Chacun des mots est évalué en fonction de son importance contextuelle, ce qui permet d'écarter les termes statistiquement moins pertinents. Ceux pour lesquels une annotation apparaîtrait par conséquent superflue.
Une annotation aussi pertinente, et plus rapide
"Pour le moment, Tagme fonctionne à partir de la base de données anglaise de Wikipedia, mais rien n'interdit de développer ce logiciel pour d'autres langues intégrées à cette plate-forme encyclopédique", précisent les chercheurs. La performance du logiciel a été validée par plusieurs expériences concluantes, ajoutent-ils. Et les résultats des algorithmes mis au point ont même concurrencé ceux utilisés pour annoter de longs extraits textuels, avec l'avantage d'effectuer l'opération plus rapidement.

Haut de page

1 Commentaire

Le lien renvoi une 404

Soumis par Hunold (non vérifié) - le 18 juin 2010 à 18h45

Mentions légales © L’Atelier BNP Paribas