Wikipédia permet de mieux indexer les vidéos en ligne

Par 06 août 2010
Mots-clés : Smart city

Pour affiner la description d'une vidéo sur Internet, il est possible d'utiliser la méthode de catégorisation de l'encyclopédie, qui recherche des concepts clés repérés dans les tags bruts pour classer les données.

L'institut des technologies informatiques de Pékin avait déjà mis en place un système allant chercher sur le Net les contenus relatifs à une vidéo pour affiner son indexation et pour enrichir par des éléments contextuels sa description. Elle prolonge aujourd'hui cette méthode en s'inspirant des techniques de catégorisation de l'encyclopédie Wikipédia, et en l'appliquant aux fichiers vidéos en ligne. Pourquoi ? Parce que de nombreuses sources libres de droit peuvent venir compléter les informations sommaires - comme les tags ajoutés par les internautes - qui décrivent une séquence. L'approche des scientifiques consiste donc à aller rechercher ces données complémentaires, pour catégoriser avec pertinence les contenus. Dans un premier temps, il s'agit d'identifier, à partir du titre d'une séquence postée sur YouTube et dans les tags qu'elle contient, trois concepts clés tels qu'ils sont utilisés par Wikipédia.
Utiliser les "concepts" de Wikipedias
Plus de trois millions de concepts, baptisés "WikiC" par les chercheurs, permettent en effet de contextualiser une scène vidéo. Pour une personne, le "métier", le "statut", ou le "caractère réel ou fictif" sont des exemples de concepts. Pour un lieu, on peut mentionner la "ville" ou le "pays", qui apportent également des informations essentielles. Enfin, d'autres concepts, comme "séries télévisées", "marque", "inventions", ou encore "sports" peuvent préciser le contenu de la vidéo. "Pour les concepts ambigus, comme 'apple', les autres tags associés à la vidéo sont analysés conjointement pour éviter tout contresens", précisent les scientifiques. Une fois les concepts identifiés, le système s'en sert pour émettre une requête sur Google.
Emettre des requêtes sur Google
Il analyse ensuite les vingt premiers résultats obtenus, un à un, des derniers aux premiers. Lorsque les trois concepts apparaissent simultanément dans l'un des résultats, celui-ci est retenu, ainsi que tous ceux qui le précédent. L'ensemble des contenus complémentaires collectés est passé au crible, des algorithmes permettant de prélever dans ces données du web quelques concepts encore plus pertinents, baptisés de "enriched WikiC", ou "EWikiC" (indiquant par exemple la notion de "capitale", plus précise que celle de "ville"). Lorsque l'on cherchera à catégoriser de nouveau la vidéo, en tenant compte cette fois non plus du titre ou des tags, mais de ces nouveaux concepts définis, cette catégorisation sera ainsi plus rapide et plus pertinente.

Mentions légales © L’Atelier BNP Paribas