Référencement : la popularité d'un article tient aux liens qu'il contient

Par 01 juillet 2010

L'un des moyens d'améliorer le classement des contenus sur Wikipédia est de coupler la traditionnelle méthode du PageRank de Google à une autre qui valorise les articles qui renvoient à d'autres pages.

Pour exploiter tout le potentiel de Wikipédia, il faut prendre en compte les interconnexions entre les articles de l'encyclopédie en ligne, affirment trois chercheurs russes*. Selon eux, le modèle du PageRank sur lequel se fonde le moteur de recherches Google pour référencer le Web ne rend pas le meilleur résultat lorsque l'on cherche à classer les articles Wikipédia. Ils proposent du coup de combiner aux algorithmes utilisés par Google ceux d'un autre modèle, nommé "CheiRank". Quand le premier évalue la pertinence d'un article en fonction du nombre de nœuds pointant vers lui, le second effectue la démarche inverse, et référencie d'autant mieux un article que celui-ci renvoie à d'autres pages de l'encyclopédie.
Un page rank en deux dimensions
"Alors que PageRank évalue principalement la popularité d'un article, CheiRank prend en compte le caractère communicatif des nœuds, les liens qu'ils tissent eux-mêmes vers d'autres articles", précise à L'Atelier Dima Shepelyansky, l'un des chercheurs. En mêlant ces deux méthodes de référencement, les scientifiques obtiennent ce qu'ils appellent un "PageRank en deux dimensions". Ils ont scruté les pages en anglais de Wikipédia avec cette approche combinée et établi un certain nombre de classements - d'entreprises, de personnalités, ou encore d'universités - qui s'avèrent selon eux plus pertinents que ceux obtenus lorsque l'on effectue la recherche avec l'outil développé par Google.
Organiser sa veille professionnelle
"En classant les articles selon le modèle de référencement en deux dimensions, nous sommes en mesure d'obtenir les listes établies et reconnues internationalement", poursuit Dima Shepelyansky. Par exemple, pour ce qui est des universités, l'ordre généré automatiquement par les méthodes de calcul combinées reproduit à plus de 70 % celui du classement de Shanghai. "Ce mode de référencement offre également des résultats pertinents pour évaluer la puissance et la capacité d'influence des entreprises les plus importantes", précise le scientifique. Ce qui pourrait s'avérer intéressant pour effectuer une veille professionnelle, par exemple. D'autant que Wikipédia évolue de façon constante et s'actualise régulièrement.
* de l'université de Novosibirsk, de l'institut Budker de physique nucléaire et du laboratoire de physique théorique du CNRS.

Mentions légales © L’Atelier BNP Paribas