L'étiquetage des Captchas devient un jeu collectif

Par 21 juillet 2009
Mots-clés : Smart city, Europe

L'université de Newcastle teste l'efficacité de ces liens déformés via un système de son cru. Pour le mettre au point, elle a fait appel aux ressources des internautes, chargés de créer une base de données de Captchas étiquetés.

Comment rendre attractif un fastidieux travail de classification manuel ? En le tournant sous forme de jeu en ligne. C'est ce qu'a choisi de faire une équipe de chercheurs de la School of Computing Science de l'Université de Newcastle. Pour améliorer l'efficacité des Captchas*, les chercheurs se sont mis à la place des spammers et ont développé un logiciel apprenant, qui essaie de toujours mieux attaquer et casser cette sécurité. Le but étant d'appréhender les failles avant les pirates. Voilà pour la première étape. La deuxième, c'est que pour mettre au point ce logiciel, ils ont fait appel aux ressources des internautes via un jeu créé pour l'occasion, Magic Bullet.
Le rôle de l'intelligence collective
Pourquoi ? Parce que pour développer ce type d'outils évolutifs, les chercheurs ont en effet besoin de constituer une base de données d'au moins dix mille morceaux de Captchas "étiquetés" - reliés manuellement à la lettre qu'ils représentent. Un travail lourd à effectuer. Le jeu en ligne, inspiré de l'EPS Game, fait indexer des photographies Google par les joueurs. Il confronte deux équipes d'au moins deux participants Il est fondé sur la collaboration : un morceau de Captcha apparaît de manière aléatoire sur l'interface. Les coéquipiers doivent alors être les plus rapides à reconnaître de quel signe il s'agit.
Fidéliser les joueurs
Et à le saisir sur leur clavier. La coordination des joueurs d'une même équipe donne sa classification au morceau de Captcha. Si les joueurs ne sont pas assez nombreux, l'ordinateur joue des données issues d'anciennes parties, afin de confirmer les informations.  Le jeu est également doté d'un système de score, afin d'inciter les participants à revenir, afin de se surpasser. "Une session moyenne de jeu produit vingt-cinq étiquetages corrects par minute, donc mille cinq cent par heure" explique Jeff Yan, qui a dirigé le projet.
*Pour rappel, ces visuels permettent de s'assurer que c'est bien un être humain et non une machine qui cherche à se connecter.

Mentions légales © L’Atelier BNP Paribas