Quand le Web sémantique indexe la connaissance

Par 12 novembre 2008
Mots-clés : Smart city

Afin de recenser et d'aider à la mutualisation du contenu pédagogique mis en ligne par les universités européennes, l'outil de recherche LT4eL fait appel à la sémantique.

À mesure que croît le contenu pédagogique en ligne, il est de plus en plus difficile de le répertorier et donc de le localiser.  D'où l'élaboration d'un moteur de recherche spécialement destiné au recensement des ressources contenues dans les plates-formes d'enseignement à distance des universités européennes. Intitulé LT4eL, c'est-à-dire "Language Technology for eLearning", cet outil se base sur les propriétés sémantiques du contenu à indexer et non seulement sur son texte explicite. Le système fonctionne grâce à un principe d'assignation semi-automatique de métadonnées aux contenus en question. Autrement dit, les tags permettant d'inventorier les textes ne leur sont pas associés manuellement mais de façon instantanée par un "extracteur de mots clés". Celui-ci propose une liste de mots clés au responsable du contenu, lequel peut décider de l'accepter, de la modifier ou de la rejeter.
Extracteur de mots clés
Un outil apparenté permet ensuite de produire une définition de ces différents mots-clés de façon à construire un glossaire exhaustif. "Les systèmes de recensement des learning management systems existants comportent souvent des ambiguïtés : comment savoir par exemple si une clé est un terme d'informatique ou de serrurerie ?" souligne Paola Monachesi, un chercheur en linguistique à l'université d'Utrecht. Grâce à ce glossaire, la personne effectuant une recherche peut s'assurer que tel contenu qui lui est proposé est vraiment pertinent. Les chercheurs travaillent également à l'élaboration d'une ontologie basée sur ces différents mots-clés et définitions. En révélant la nature des liens sémantiques entre les différents contenus, le moteur doit permettre de mieux les hiérarchiser et ainsi d'effectuer des recherches à la fois littérales mais aussi conceptuelles.
Un outil en open source
L'un des principaux avantages de LT4eL réside dans le fait qu'il permet de croiser les ressources apparentées dans différentes langues. Le prototype est pour l'instant capable de lire des documents en Tchèque, en Bulgare, en Anglais, en Allemand, en Polonais, en Portugais et en Roumain. Ce qui pourrait être particulièrement utile pour des élèves étudiant à l'étranger dans le cadre de programmes d'échange type Erasmus : "Imaginons des élèves polonais qui suivent des cours en Anglais mais préfèrent lire des documents en polonais. Avec LT4eL, ils peuvent effectuer leurs recherches en anglais mais obtenir les documents qu'ils souhaitent dans leur langue d'origine". LT4eL est développé en open source dans le cadre du sixième programme cadre pour la recherche et le développement technologique.

Mentions légales © L’Atelier BNP Paribas