Alipr s'appuie sur des mots clés pour indexer les images

Par 15 octobre 2008

Ce moteur de recherche se base sur une banque de photographies taguées manuellement pour apprendre à reconnaître de nouveaux clichés.

À l'heure où le Web intègre de plus en plus de contenus dits "riches", les méthodes d'indexation de formats comme les photos ou les images se multiplient. Après le MIT et l'université de San Diego, c'est au tour de l'université d'État de Pennsylvanie de réfléchir à la conception d'un moteur de recherche pour images. Basé sur une méthode statistique, le projet s'intitule "Automatic Linguistic Indexing of Pictures in Real-Time" (ALIPR). Là encore, plutôt que de baser la recherche sur le texte environnant les photos, l'objectif est d'apprendre aux ordinateurs à reconnaître le contenu même des clichés, qu'il s'agisse d'immeubles, de paysages, de personnes etc. Principale différence avec le système développé par le MIT : tandis que ce dernier utilise les codes - les suites de bytes - des images pour les identifier, la technologie de la Penn State mise sur un logiciel de reconnaissance des objets et des formes à l'aide de mots clés indexés manuellement.
Soixante mille tags
La méthode utilisée par les chercheurs consiste en effet à référencer à la main une base de photos la plus large possible. Soixante mille photos ont déjà été taguées à l'aide de mots décrivant leur contenu. "Nous avons par exemple sélectionné une centaine de photos de parcs et les avons référencées avec des mots-clés tels qu'arbre, herbe, paysage etc." explique Jia Li, professeur à la Penn State. "Cela permet de construire un modèle statistique grâce auquel la machine apprend à reconnaître divers éléments tels que la couleur ou la texture de ces photos." Grâce à cette technique, l'ordinateur doit par la suite être capable de reconnaître les mêmes éléments dans de nouveaux clichés. De sorte qu'une personne faisant une recherche pourra utiliser les mêmes mots-clés pour obtenir des images pertinentes.
Un système perfectible
"Les méthodes d'indexation traditionnelles des images se réfèrent aux noms qu'on a donné aux photographies ou au texte qui se trouve sur les mêmes pages. Mais la plupart du temps, ces termes ne sont pas suffisamment pertinents, de sorte que la recherche donne de mauvais résultats". La technique d'indexation ad hoc développée par Jia Li et ses collègues se veut plus précise : elle permet d'assigner de façon appropriée au moins un mot-clé sur sept à chaque photo référencée. La solution doit cependant être perfectionnée. Ce, en augmentant continuellement le nombre de mots clés référencés. À l'instar des chercheurs du MIT, Jia Li prévient cependant : aucun moteur de recherche d'images ne sera jamais fiable à 100 %. "Les images sont bien plus diversifiées que la structure logique d'une phrase".

Mentions légales © L’Atelier BNP Paribas