Le Web sémantique doit encore bâtir sa tour de Babel

Par 19 septembre 2008
Mots-clés : Smart city, Europe

Pour mieux répertorier les informations accessibles sur Internet, des chercheurs proposent de les analyser selon un modèle grammatical commun à toutes les langues.

Des chercheurs ont élaboré une nouvelle méthode de construction d'ontologies multilingues. L'un des principaux enjeux du Web sémantique réside en effet dans l'invention d'ontologies (ou ensembles des termes qui représentent le sens d'un champ d'information) susceptibles d'améliorer les outils de recherche en ligne. Jusqu'à présent, les ontologies utilisées par le Web sémantique butaient sur un même problème : la diversité linguistique. L'innovation de la faculté d'informatique de l'université polytechnique de Madrid réside dans l'utilisation d'éléments extralinguistiques, ou plutôt communs à toute langue naturelle. La méthode proposée consiste à analyser les structures grammaticales, ou modèles linguistiques, sous-jacents aux diverses langues.
Informations codées en langage UNL
Dans la mesure où ces modèles fonctionnent de manière universelle, elles peuvent correspondre à des ontologies fonctionnant pour chaque langue existante. Les chercheurs espagnols expliquent que leur projet consiste à élaborer des noms-concepts fonctionnant dans toutes les langues. Ils revendiquent une approche similaire à celle du projet UNL (Universal Networking Language), mis en œuvre par l'Université des Nations Unies. Il s'agit d'un langage informatique qui code le sens des énoncés de quatorze langues. Cette représentation abstraite fonctionne comme un pivot interlingue : ce n'est pas une langue en tant que telle et elle ne peut donc pas être utilisée par les non spécialistes. Auparavant, l'une des solutions envisagées par le Web sémantique pour bâtir des ontologies multilingues consistait à utiliser comme pivot une véritable langue.
Eviter les ambiguïtés inhérentes aux langues naturelles
Le plus souvent l'anglais. Problème : l'utilisation d'une langue naturelle comme d'un langage universel occasionnait justement des ambiguïtés irrémédiables. N'étant pas une langue proprement dite, le langage UNL évite de telles ambiguïtés et à même de correspondre assez précisément à diverses ontologies. Rappelons pour mémoire que l'ontologie appliquée à l'informatique désigne l'ensemble des termes et des concepts représentant le sens d'un champ d'informations. Décrivant non seulement des individus mais aussi les classes auxquelles ils appartiennent, les qualités qu'ils possèdent, les relations qu'ils ont les uns aux autres et les évènements qui leur arrivent, les ontologies permettent de modéliser divers ensembles d'informations afin qu'elles soient indexables d'une façon aussi exacte que possible.

Mentions légales © L’Atelier BNP Paribas