Détecter les sujets émergents n'est pas qu'une affaire de mots clés

Par 17 octobre 2011 1 commentaire
buzz

En enregistrant l'activité normale des utilisateurs, il devient possible d'associer un changement de celle-ci avec l'émergence d'un buzz

Pour identifier au plus vite les sujets en vogue sur les réseaux sociaux, la solution ne serait pas de chercher sur l'ensemble des messages échangés des mots en fonction de leur fréquence, selon trois chercheurs de l'université de Tokyo*. Mais plutôt de s'intéresser au comportement d'un panel de membres et d'identifier l'imminence d'un buzz quand leurs habitudes de publication changent de la normale. Ils ont ainsi mis au point un modèle qui se concentre sur les utilisateurs et leurs interactions. Pour les chercheurs, la justification est simple : un sujet de discussion peut parfois être constitué d'une seule image, ou d'une piste audio. Et dans ce cas, les méthodes classiques de repérage ne fonctionnent évidemment plus.

Une détection basée sur la "normalité" du comportement

Le logiciel mis au point fonctionne selon deux cycles. En premier lieu, il va analyser un certain nombre d'utilisateurs de tel ou tel réseau social (dans le cas des tests : Twitter), et va enregistrer le comportement "normal" de ceux-ci  (nombre de publications, fréquence de mentions d'autres personnes...). Une fois cette tâche effectuée, il continuera d'analyser le réseau, mais sera désormais capable d'identifier un comportement dit anormal de la part d'un des utilisateurs enregistrés. Par exemple, une augmentation du rythme de tweets, la mention répétée d’un mot précis, l'envoi soutenu de messages à une personnes ou à un groupe différent de d'habitude... Et si plusieurs utilisateurs adoptent un comportement plutôt étonnant à des instants rapprochés, alors le logiciel signalera l'émergence d'un buzz.

Des tests concluants

La phase de tests a été concluante, puisque la mise en évidence de phénomènes émergents a été au moins aussi rapide à l'aide de cette méthode qu'avec la méthode basée sur la détection de mots clés. Et il est intéressant de noter que la méthode des chercheurs s'est révélée bien plus efficace dans les cas où les mots-clés étaient plus difficiles à définir (les chercheurs citent ainsi le thème "NASA"). Concluons en signalant que les deux méthodes ne sont pas incompatibles : les chercheurs n'excluent pas d'employer des fonctions de recherche de contenu afin de rendre leur logiciel encore plus performant

Haut de page

1 Commentaire

Peut-on avoir la référence de l'étude (ou le nom des chercheurs, le papier, etc.) ?!

Merci.

Soumis par Camille (non vérifié) - le 19 octobre 2011 à 14h56

Mentions légales © L’Atelier BNP Paribas