Combiner hasard et similarité affine la recommandation

Par 15 mars 2010 1 commentaire

Pour introduire de la diversité dans le conseil de produits en ligne, des chercheurs sino-slovaco-suisse proposent un système qui sélectionne des contenus en fonction des préférences mais aussi de manière aléatoire.

Pour assurer la pertinence et surtout la diversité des contenus recommandés sur les sites de e-commerce, il ne faut pas se baser uniquement sur la similarité des contenus. Le postulat est tenu par une équipe de chercheurs sino-slovaco-suisse*, pour qui adopter ce schéma élimine de facto les produits de niche, potentiellement plus intéressants pour l'internaute. Pour éviter cela, ils proposent un système qu'ils baptisent d'"hybride" et qui propose des résultats diversifiés. Le tout, sans que cela ne nuise à la pertinence générale. Leur dispositif combine en fait deux approches. La première, dite de "diffusion de chaleur", répartit les contenus parmi les utilisateurs selon le principe de la marche aléatoire, un schéma qui s'appuie sur le principe du hasard.
Une combinaison de deux algorithmes
Les actions sont effectuées de manière aléatoire, et ne prennent jamais en compte que l'état présent du dispositif. La seconde s'appuie sur les préférences d'utilisateurs présentant un profil similaire à celui de l'internaute. Prises individuellement, les performances de ces deux méthodes sont assez faibles. Leur combinaison, en revanche, offre des résultats très encourageants. Pour tester leur idée, les chercheurs se sont intéressés à une base de données répertoriant les produits culturels choisis par des internautes sur Netflix, Rateyourmusic ou Delicious. Pour chaque utilisateur, les scientifiques ont ôté de la base de données 10 % des produits sélectionnés.
Affiner la combinaison en fonction des usages
Les différentes méthodes ont ensuite été évaluées en partant du principe que les plus efficaces seraient celles qui recommanderaient ces objets. Ils servent en fait d'étalon pour estimer la pertinence des résultats. L'intérêt de la combinaison de deux algorithmes est qu'elle permet de personnaliser le système de calcul obtenu. Sur certains sites on sera tentés de favoriser la pertinence des recommandations et sur d'autres, la découverte de contenus. Le seul défaut de ce système est qu'il demande une plus grande puissance de calcul puisque les recommandations sont calculées plusieurs fois.
* L'université de Fribourg, l'université de Sciences et de Technologies de Chine, l'université de Shanghai pour les Sciences et la Technologie et l'université Pavol Jozef Šafárik ont contribué au projet

Haut de page

1 Commentaire

Article très intéressant, merci pour cette étude.

Soumis par Mykitxenon (non vérifié) - le 11 juin 2010 à 11h51

Mentions légales © L’Atelier BNP Paribas