Les réponses à une recherche multimédia se trouvent dans la question

Par 03 mars 2009
Mots-clés : Smart city

Le moteur de recherche SAPIR retrouve un contenu à partir d'indices donnés par l'utilisateur. Par exemple une photographie prise par téléphone portable ou une mélodie fredonnée.

Les contenus multimédias font partie intégrante du paysage Internet. Pourtant, les moteurs de recherche classiques, comme Google, Yahoo ou MSN, continuent à uniquement utiliser les mots pour construire leurs systèmes et indexer les sites. Ce, même dans le cas de contenus qui ne sont pas des textes : ces éléments sont alors identifiés d'après les termes qui leur sont associés. Avec ces seuls mots-clés, il est difficile de retrouver une image, un fichier audio ou une vidéo dont le souvenir n'est pas précis. SAPIR, le projet de moteur de recherche développé par l'institut d'informatique allemand Max Planck, vise à résoudre ce paradoxe. Le prototype, présenté au CeBIT 2009, étend cette recherche dans les textes et les métadonnées jusqu'au cœur des contenus multimédias eux-mêmes.
Une image pour retrouver le contenu
Au lieu de chercher des informations textuelles, le moteur utilise la structure même des données de requêtage. Cela signifie que l'utilisateur définit ce qu'il cherche, en proposant une "image", une ébauche de ce qu'il veut retrouver. Cela peut être une photographie qu'il prend avec son téléphone portable, ou encore une mélodie dont il chantonne l'air. À partir de cette requête, le logiciel identifie les similitudes entre les contenus reçus et les fichiers indexés. Il donne alors à l'utilisateur le nom du monument photographié ou du morceau de musique qu'il fredonnait.
Une architecture Peer-To-Peer
Pour ne pas être trop lent, SAPIR doit sauvegarder son index de recherche. Un moteur de recherche classique, basé sur du texte, peut travailler avec des serveurs dans un centre de données central. L'utilisation de SAPIR ne peut se faire par ce biais, en raison de la trop grande quantité de données qu'il véhicule. Le moteur de recherche s'appuie donc sur un réseau de pair à pair (P2P). Le recours à cette structure dispersée permet de sauvegarder l'indexation de manière décentralisée. Ce qui rend le processus de recherche plus flexible, plus stable, mais aussi plus apte à se développer et à monter en charge. Cette architecture permet d'intégrer les téléphones portables sur le réseau.

Mentions légales © L’Atelier BNP Paribas