Analyser le contenu des blogs pour retourner à la source de l'information

Par 02 septembre 2010
Mots-clés : Digital Working, Europe

L'ISCPIF (Institut des systèmes complexes) a développé un algorithme pour mesurer le degré d'influence des blogs, qui pourrait contribuer à améliorer la recherche Internet en temps réel.

La recherche d'information en temps réel se développe, notamment en France avec des sociétés comme Exalead. En ce qui concerne les sites Internet et les blogs, les moteurs de recherche se fondent encore - pour établir leur ranking, c'est-à-dire leur ordre d'affichage - sur les rétro-liens et sur la fréquence de parution. Autant d'indices censés transmettre un rendu pertinent du degré de vitalité et d'actualisation d'un site. Une équipe de chercheurs français de l'ISCPIF (Institut des systèmes complexes) travaillant dans le cadre du projet Webfluence*, a pris un parti opposé. En se basant sur un terrain d'étude donné, des blogs politiques, ils ont décidé d'analyser et de classer en unités de discussion, et d'interaction, tant le contenu éditorial des sites que leurs relations sémantiques temporelles.
Mettre à jour les relations sémantiques temporelles entre les blogs
Les scientifiques se sont ainsi penchés sur un corpus mis à leur disposition par Linkfluence, un institut d'étude spécialisé dans l'analyse des médias sociaux. Le but ? Remonter à la source de l'information, via une analyse sémantique des blogs considérés. "Il s'agit ici de déterminer qui est à l'origine du buzz, des messages, qui crée l'information et les tendances, et, par opposition, en dehors de toute question liée à la fréquence de parution, quels sont les sites qui ne font que reprendre du contenu", explique à L'Atelier, Telmo Menezes, l'un des chercheurs. "Or, aujourd'hui, ce type de critères n'est encore que partiellement pris en compte par les moteurs de recherche", précise-t-il.
Pas d'application immédiate
L'idée étant donc de reconstruire toute la chaîne de diffusion, et d'attribuer un score plus élevé aux blogs se trouvant à la source du contenu. Dans un registre connexe on peut également envisager des applications dans le monde de l'entreprise, pour déterminer en temps réel ce qui se dit sur le web et dénicher par exemple les meilleurs interlocuteurs pour faire passer un message sur le Net, sans heurter la susceptibilité des utilisateurs du réseau. Mais si la recherche fondamentale est une chose, "l'implémentation d'un principe algorithmique et son application prend du temps, beaucoup de temps", explique à L'Atelier, Guilhem Fouetillou, Directeur général de Linkfluence.
* un projet soutenu par l'ANR (Agence Nationale de la Recherche) en collaboration avec le CNRS (CREA), Orange Labs et le laboratoire d'informatique de l'université Paris 6.

Mentions légales © L’Atelier BNP Paribas