Le web des données doit trouver un processus pour s'organiser

Par 28 avril 2009 2 commentaires
Mots-clés : Smart city, Europe

Si les technologies sémantiques se popularisent, il reste difficile d'effectuer des recherches dans une partie d'un document. Seul un processus cohérent d'annotation pourrait changer cet état de fait.

"L'utilisateur recherche une donnée disponible dans un document sans vouloir celui-ci dans son intégralité", signale Raphaël Troncy, du Centre for Mathematics and Computer Science d'Amsterdam. Le groupe de recherche cherche donc à mettre au point un mécanisme standard pour pointer automatiquement sur n'importe quelle partie d'un fichier multimédia. Le groupe part du postulat que le web des données existe déjà. Et qu'il faut désormais le structurer pour que la connaissance qui y circule aide à accéder de manière pertinente à l'information. Pour éprouver le concept le groupe, dirigé par Lynda Hardman, a organisé un test grandeur nature : E-culture MultimediaN. Ce moteur de recherche sémantique du Rijk Museum cherche dans les collections en fonction du contexte. Le moteur est par exemple capable d'afficher les relations entre deux courants ou deux peintres, ou encore d'afficher des œuvres contemporaines à l'artiste recherché.
Annoter les fragments
Cela a nécessité l'intervention d'humains. Chacun d'entre eux était invité à annoter une peinture en répondant aux questions : qui, quand, où, quoi. Les données fournies par les autres participants étaient alors proposées à chaque fois pour affiner l'annotation. Le but ? "Avoir une sémantique explicite des informations permet de mieux classifier, retrouver et présenter celles-ci, par exemple en utilisant les termes plus généraux et plus spécifiques des concepts demandés", explique Raphaël Troncy. Mais aussi se rendre compte des précautions à prendre avant de développer une application de classification sémantique, comme la nécessité de préciser en amont les besoins de l'utilisateur. Le but à terme est de proposer des applications permettant d'accéder directement à une information du nuage de données.
Accéder directement à une partie d'un document multimédia
"Seule la séquence voulue par l'utilisateur sera transmise sur le réseau, et non pas la vidéo dans son intégralité", poursuit le chercheur. "Ce processus fournira un gain important de bande passante à l'heure où de plus en plus de terminaux accèdent au web, par exemple depuis des téléphones portables". Une telle approche a de fortes chances d'intéresser le secteur du marketing et celui du commerce. "Ces technologies permettent de mieux agréger des informations hétérogènes, de personnaliser l'accès, de mieux filtrer et présenter les informations dans un contexte où nous sommes surchargés de données et donc de mieux adapter un produit à un public". E-culture fait partie d'un ensemble de projets financés par le gouvernement hollandais et réunis sous le nom de MultimediaN. Il a été présenté à l'occasion du WebSci09 d'Athènes, auquel L'Atelier était présent.

Haut de page

2 Commentaires

Les media avertis comme vous devraient être un peu plus critiques vis à vis des annonces "scientifiques" autour du Web Sémantique. Cela fait 8 ans que l'on nous annonce cette merveille, qui bien sûr n'est pas pour demain. 8 ans, c'est une éternité sur Internet, et rien de significatif ne se passe. Car tout simplement nous ne possédons pas la science de la compréhension automatique du langage naturel. Tim Berners Lee a inventé le Web car il savait le faire; puis il a inventé le Web Sémantique car il ne savait pas le faire.il est assez simple d'être critique. Mais nous préférons laisser cette noble tâche aux experts. Notre rôle de journalistes à L'Atelier - dans l'espace actualité et sur ce site - est de transmettre l'information.

Cordialement,

La rédaction

Soumis par Jean Rohmer (non vérifié) - le 29 avril 2009 à 12h46

Jean,
Le but de l'article n'est pas de faire une énième nouvelle annonce sur l'existence ou l'arrivée du web sémantique, ce ne serait d'ailleurs pas intéressant.
Le fait est que le web contient de plus en plus de données structurées, exposées selon des mécanismes simples: URI, RDF, relations entre les données.

Les moteurs de recherche encouragent désormais la publication de telles données: SearchMonkey pour Yahoo!, Google Rich Snippet depuis une semaine.

Les problèmes mis en avant par l'article sont désormais comment mettre à profit cette masse de données disponible et comment interagir avec elle.

Nos projets de recherche ont comme objectif d'apporter des réponses à ces questions et nos prototypes sont utilisés dans de réelles applications d'entreprises.
Bien cordialement.
Raphaël Troncy

Soumis par Raphaël Troncy (non vérifié) - le 20 mai 2009 à 12h30

Mentions légales © L’Atelier BNP Paribas