Le graphique se convertit en texte

Par 22 septembre 2008
Mots-clés : Smart city

Le système développé par la Penn State University référence le contenu des diagrammes en 2D. Pour cela, il analyse les données qui y sont contenues afin de n'indexer que du texte.

Les méthodes de recherche se raffinent. Il reste cependant difficile pour un moteur d'étudier simultanément des éléments de texte et des images. Une équipe de la Penn State University propose un dispositif qui transforme les graphiques 2D en données. Ainsi, les contenus visuels sont indexés comme du texte. Par la suite, le moteur a la possibilité de chercher simultanément dans les deux formats. Les applications en entreprise sont nombreuses : recherche simplifiée de statistiques, de rapports... Toute la difficulté a été d'apprendre à l'ordinateur à reconnaître un graphique et à l'interpréter. Difficile en effet de déterminer les liens et le sens des lignes, courbes, points, légendes et autres données qui constituent un graphique.
Chercher le contexte
C'est pourquoi les chercheurs ont développé un logiciel d'apprentissage automatique évolutif. Celui-ci identifie les contenus en 2D présents dans la base de données du moteur. Il les segmente ensuite en trois parties : la première reconnaît le bas du graphique, qui contient les données inscrites à l'horizontale. La deuxième regroupe les informations proposées à la verticale, et la dernière le cœur du graphique et les légendes. Le système cherche ensuite les liens qui rattachent les différents points du graphique entre eux et tâche de les comprendre. Les résultats sont alors présentés de manière linéaire et au format texte. Une fois ce travail effectué, le système comprendra plus rapidement le contexte d'un graphique.
Simplifier la recherche de documents en entreprise
Il saura faire le lien entre des séries de chiffres lorsqu'il effectuera une nouvelle recherche. Un tel système aidera également les chercheurs à retrouver plus simplement des documents dont ils ont besoin pour leurs travaux : de nombreux résultats sont souvent reportés sous la forme de graphiques. Les retrouver est alors une tache ardue, surtout quand les moteurs ne peuvent se fier qu'aux mots-clés traditionnels rattachés au document, ou aux textes et légendes qui le précèdent ou le suivent. Dernier usage envisagé : les statistiques sportives. "Un parieur pourra se faire très rapidement un tableur reprenant des résultats de courses ou de compétitions et reportés sur de multiples graphiques", explique ainsi Prasenjit Mitra, co-responsable du projet, au New Scientist.

Mentions légales © L’Atelier BNP Paribas