Les épidémies de grippe prévisibles sur Twitter

Par L'Atelier - Paris 30 juillet 2010 Laisser un commentaire

L'université de Louisiane a mis en place un système qui prédit l'imminence et la propagation d'une telle maladie à partir des messages postés sur le site de micro-blogging. Tout en réduisant le risque de fausses alertes.

Si les sites de micro-blogging ont déjà prouvé leur efficacité à mesurer le succès d'un produit ou encore l'humeur d'une population, il semblerait qu'ils soient aussi utiles pour prédire des événements épidémiques comme la grippe à l'échelle d'une nation. Une équipe de la Southeastern Louisiana university a analysé pendant huit mois plus de 500 millions de tweets. En compilant chaque message relié à des termes tels que "grippe", "malade", "rhume", ces derniers ont prouvé qu'il était possible de pronostiquer la propagation de la maladie. "Nos résultats correspondent à 95 % à ceux fourni par les statistiques nationales de santé", explique l'équipe dans son rapport. Les scientifiques remarquent également que les résultats de prédiction peuvent être plus précis si l'on affine l'analyse sémantique de la recherche.

Mesurer la probabilité d'une fausse alerte

Soit, si l'on prend en considération qu'un message composé du terme "grippe" ne correspond pas automatiquement à la déclaration d'un symptôme par les micros blogueurs. Mais à un sujet analogue pouvant correspondre à une annonce politique sur des résultats de santé nationaux, des rappels de vaccins à effectuer ou encore un nouveau type d'injection. A cet effet, l'équipe a mis en place un logiciel capable de mesurer la probabilité d'une fausse alerte. A partir d'un échantillon de deux cents messages manuellement catégorisés en message positif - relatant directement un symptôme - et négatif - hors sujet -, le programme prédit statistiquement, et d'après le fichier d'observation, la valeur catégorielle de chaque tweet.

Twitter : une base de données avantageuse

Soit 0 pour un message négatif et 1 pour un positif. "Même si les programmes de surveillance nationaux comme ILINet sont efficaces pour détecter un début d'épidémie, leur usage est coûteux et permet simplement des prévisions à court terme", indiquent les chercheurs. Dans leur rapport, ces derniers avancent plusieurs raisons qui permettent de considérer Twitter comme une caisse de résonance avantageuse. "Les micros messages sont descriptifs et facilement disponibles pour une analyse", avancent-ils. A en croire leur étude, cette base de données peut aussi autoriser une analyse démographique grâce aux données - âge, ville, état, sexe - des micros blogueurs.

Haut de page

Réagir à cet article

Le contenu de ce champ sera maintenu privé et ne sera pas affiché publiquement.
Saisissez les caractères contenus dans l'image ci-dessus. (vérifier en utilisant un son)
Entrez le texte que vous voyez dans l'image ci-dessus. Si vous ne pouvez pas le lire, soumettez le formulaire et une nouvelle image sera générée. Insensible à la casse.

Mentions légales © L’Atelier BNP Paribas