Sur Internet, quelques sites suffisent à diffuser largement l'information

Par 04 juin 2010 1 commentaire

La propagation des contenus d'actualité sur la Toile suit un parcours qu'il est possible de calculer par avance. Quelques principaux diffuseurs alimentant l'ensemble du web en informations.

Les mécanismes de diffusion de l'information sur la Toile sont structurés autour des mêmes rouages principaux, affirment des scientifiques de l'université de Stanford et de l'institut technologique de Californie. C'est-à-dire que les contenus doivent passer en amont majoritairement par un nombre restreint de diffuseurs s'ils veulent être propagés ensuite à large échelle. L'objectif de leur recherche a été d'analyser la transmission des informations entre différents nœuds du réseau Internet - "quel nœud influence quel autre, et de quelle manière ?". Ils ont proposé du coup un algorithme qui calcule les probabilités de "contagion" ou de "propagation" de l'information, en établissant mathématiquement le parcours le plus vraisemblable. Ils ont démontré dans leur étude* l'efficacité de cet algorithme en le mettant à l'épreuve à partir de données collectées sur Internet.
Suivre la diffusion de l'information
Plus de 170 millions de billets et d'articles d'actualité, provenant d'un million de sites en ligne, sur la période s'échelonnant de septembre 2008 à août 2009. "A partir de ces données, nous avons appliqué deux méthodologies afin de suivre la diffusion de l'information", expliquent les chercheurs. D'abord, l'étude des hyperliens présents dans les billets postés sur les blogs pour observer les principaux canaux diffusant les flux d'informations. Puis, pour affiner leur observation, la méthodologie de l'outil sémantique dit du "MemeTracker", qui leur permet d'extraire plus de 340 millions de courtes phrases d'actualité, comme "Joe, le plombier", ou "rouge à lèvres sur un cochon" (autant de phrases prononcées pendant la campagne présidentielle américaine).
Une structure centrale
Pour étudier ensuite la diffusion en cascade de ces phrases sur les blogs, comparativement au temps séparant chaque vague de propagation. Résultat : "le réseau de diffusion des informations tend à se fonder sur une structure centrale, avec quelques principaux sites d'actualité propageant largement les nouvelles sur la Toile", constatent les chercheurs. A noter : ces derniers sont partis du postulat que nombre d'études se sont focalisées sur la propagation des virus malveillants, mais qu'il est essentiel de s'intéresser également à la structure de leur diffusion. Et d'élargir ce champ d'étude aux vagues de propagation d'informations sur le Web.
* "Inferring Networks of Diffusion and Influence"

Haut de page

1 Commentaire

Et d'élargir ce champ d'étude aux vagues de propagation d'informations sur le Web.

Soumis par videos (non vérifié) - le 06 juin 2010 à 16h06

Mentions légales © L’Atelier BNP Paribas