Quand l'activité des contributeurs sur Wikipédia se prédit

Par 25 octobre 2011
Mots-clés : Smart city, Amériques, Asie, EMEA
wiki

L'encyclopédie en ligne a observé des difficultés quant aux capacités d'intégration des nouveaux participants dans la communauté. Observer leur activité permettrait de réduire le nombre de défections.

Depuis 2007, seuls 12 % des nouveaux éditeurs sont toujours actifs un an plus tard sur Wikipédia, contre 40 % auparavant. Selon le géant américain, cela serait dû au fait que la communauté des contributeurs deviendrait de plus en plus imperméable aux nouvelles additions. Du coup, dans le cadre du Wikipedia Participation Challenge, des chercheurs de Birkbeck (université de Londres) ont cherché un moyen de prédire le nombre de fois qu'un contributeur éditera du contenu sur Wikipedia. Cela, sur une période de 5 mois. A noter que les données portent sur l'historique des éditions d'utilisateurs pris au hasard entre 2001 et 2010. Un contributeur est considéré comme actif s'il a réalisé au moins un edit entre 2009 et 2010.

Différents paramètres à prendre en compte

Ici, les scientifiques se sont uniquement focalisés sur une dynamique temporelle et ont observé comment les changements dans les habitudes d'édition sur une période peuvent indiquer la future activité de l'utilisateur. On constate que plus le nombre d'éditions réalisées par un même utilisateur sur des articles donnés diminue dans les 5 mois précédant le moment du test et plus l'écart temporel entre deux éditions d'un même article est long, plus l'activité d'un contributeur dans les 5 mois suivants diminuera. Le modèle est évolutif puisqu'il prend également en compte le nombre total des éditions réalisées sur Wikipedia afin de pouvoir pondérer les prédictions propres à chaque utilisateur. Il est donc possible de déterminer avec plus ou moins de précision si un éditeur s'apprête à quitter la communauté et à devenir inactif.

Un modèle imparfait mais applicable à d'autres secteurs

Les scientifiques reconnaissent toutefois que le modèle est loin d'être parfait puisqu'il ne peut déterminer les raisons du changement de comportement éventuel des utilisateurs. Il faudra se pencher sur plusieurs points pour expliquer ce phénomène : le contributeur a-t-il vu certains de ses articles effacés ? Ses éditions critiquées dans les commentaires ? Il offre néanmoins des pistes pour réussir à prendre soin des contributeurs en voie de départ. En revanche, les chercheurs précisent que le modèle mathématique construit, puisqu'il est purement mécanique, temporel et ne se base sur aucune donnée sémantique, pourrait être appliqué à d'autres domaines comme les futures dépenses de consommateurs dans un supermarché.

Mentions légales © L’Atelier BNP Paribas