La distinction entre humain et ordinateur tient à une illusion d'optique

Par 04 novembre 2009
Mots-clés : Smart city, Moyen-Orient

En s'inspirant de la capacité humaine à extraire un sujet d'un ensemble de taches noires apparemment non pourvues de sens, des chercheurs indiens proposent une nouvelle approche des Captcha.

Avec l’amélioration constante des capacités de reconnaissance d’image des ordinateurs, il devient plus difficile pour les systèmes de sécurité type captcha (Completely Automated Public Turing test to tell Computers and Humans Apart) de distinguer un utilisateur humain d’une machine. C’est pourquoi un groupe de chercheurs* propose de recourir à l'illusion d'optique : c'est-à-dire d'utiliser des images faites de taches noires en trois dimensions et contenant un sujet reproduit de telle manière que le système visuel humain le perçoit. Pourquoi ? Selon eux, de tels clichés sont difficilement reconnaissables par un algorithme automatique. Tout en restant identifiables par un internaute humain. Pour y parvenir, ils ont modélisé une silhouette humaine. Le modèle 3D a ensuite été redessiné en employant de gros points noirs, semblables à des taches d’encre. Les chercheurs ont conçu leur logiciel pour que l’image synthétisée ne divulgue que très peu d’informations si on la segmente - la méthode la plus utilisée par les machines.
Traiter le sujet à part
L'absence de structure de petites parties de l'image les rend impossibles à identifier de manière locale. Les chercheurs expliquent que le défi ne tient pas tant à la génération d’images localement non identifiables. Mais de faire en sorte que l’ensemble reste, lui, reconnaissable. La production des taches n’est donc pas laissée au hasard et se doit de respecter la forme du sujet, sa pose et sa silhouette. Le personnage est traité à part dans un premier temps en identifiant clairement ses contours et ombrages. De la densité des taches à ces endroits dépendra la difficulté de reconnaître l’image finale. Enfin, les taches correspondant au décor sont ajoutées de manière plus aléatoire. Cela inclue la copie de celles constituant le sujet pour empêcher sa localisation du sujet par un ordinateur.
Une capacité difficile à reproduire
Les chercheurs s’appuient en fait sur la capacité humaine à reconstituer une image à partir d’un ensemble de pièces d’apparence dénuées de sens. Par exemple quand la frontière entre le sujet et le décor est mal définie. Son identification n’est alors permise qu’en s’intéressant à l’image dans son ensemble et pas aux différentes parties qui la composent. Un mécanisme encore largement inexpliqué, et qu’il est donc très difficile de reproduire à l’aide d’un algorithme automatique. Les chercheurs insistent cependant sur la nécessité d’employer un sujet avec lequel les utilisateurs soient familiers. Une version de leur algorithme adaptée aux images animées est actuellement en développement.
* Les scientifiques travaillent au sein de l’institut Indien de Technologies, de l’université Nationale Cheng Kung (Taiwan) et de l’université de Tel Aviv.

Mentions légales © L’Atelier BNP Paribas