La publicité contextuelle peut mieux faire

Par 17 juin 2008
Mots-clés : Future of Retail

La division Recherche de Yahoo! a conçu des méthodes permettant de rendre plus fiable l'affectation de publicités à des pages web selon leurs thèmes. Et pour le faire plus vite.

Sur Internet, cibler une publicité signifie aujourd’hui se rapprocher de la thématique de la page web où elle s’affiche. Car tout ce que l’on sait de l’internaute, c’est qu’il est en train de consulter cette page, et éventuellement les mots clés qu’il a tapés s’il s’agit d’un moteur de recherche. On est encore bien loin des analyses comportementales des internautes. Or, les méthodes conventionnelles de publicité contextuelle, qui sélectionnent les publicités en fonction du contenu des pages sur lesquelles elles s’affichent, ne produisent pas forcément des résultats très fiables, indique une équipe de scientifiques de Yahoo! Research. En effet, la démarche la plus commune consiste à rapprocher publicités et pages web par le biais de mots clés, lorsque les même termes ou expressions apparaissent dans les deux.
Des outils sémantiques extraient le sens des mots
Cependant, cette approche a des limites, car un mot sorti de son contexte peut changer de sens. Yahoo! Research donne l’exemple d’une page qui traiterait du golfeur Tiger Woods et qu’un moteur de publicité contextuelle associerait à une publicité pour un zoo, en inférant que l’on traite d’un tigre (tiger en anglais). Au-delà de la seule présence des mots, il faut donc considérer leur sémantique. Pour cela, l’équipe de Yahoo! Research a créé une grande structure arborescente permettant de classifier les mots par thèmes, appelée taxonomie. La notion de proximité au sein de la taxonomie permet de vérifier si des mots sont liés par leur sens. Les chercheurs ont intégré cette proximité au calcul des scores affectés aux publicités candidates pour une page web donnée. Par exemple, une publicité ayant trait au ski aurait un très bon score pour une page relative à un autre sport d’hiver.
Un court résumé permet l'analyse des pages à la volée
Il ne suffit pas de faire les bonnes associations. Il faut aussi les faire très vite, souligne Yahoo! Research, soit en quelques centaines de millisecondes, pour ne pas retarder l’affichage de la page. Les pages au contenu statique laissent aux moteurs de publicité contextuelle le loisir de les examiner en avance. Mais les pages au contenu largement dynamique telles que fils de news, blogs ou forums doivent être examinées au moment où elles sont transmises à l’internaute. Dans la majorité des cas, analyser l’intégralité d’une page à la volée serait bien trop long. Pour contourner ce problème, les chercheurs ont développé un algorithme capable de sélectionner un extrait très court mais très informatif : d’après les expérimentations, ce résumé ne dépassant généralement pas 500 Ko ou une centaine de mots reste compétitif face à la page entière, au niveau de la sélection de publicités. En attendant, du côté des outils commercialisés aujourd’hui, Yahoo! vient de reconnaître de manière tacite la supériorité de la publicité contextuelle de Google, en annonçant la semaine dernière la signature d’un accord qui lui permettra d’afficher des publicités fournies par ce dernier.

Mentions légales © L’Atelier BNP Paribas