L'internaute accède au savoir dans toutes les langues

Par 17 juin 2009 1 commentaire

L'outil de l'université John Hopkins recherche en plusieurs langues dans le contenu des bases de connaissances en ligne. Il réalise ensuite une synthèse des informations obtenues dans la langue de l'utilisateur.

Pour permettre d'accéder aux contenus présents sur les bases de connaissances mais rédigés dans une langue étrangère, Mikhail Basilyan de l'université John Hopkins a mis au point un système de recherche multilingue. Celui-ci trouve les informations correspondant à une recherche en plusieurs langues. Puis il réalise une synthèse à partir des informations les plus pertinentes. Synthèse traduite ensuite automatiquement dans la langue de l'utilisateur. Pourquoi développer ce type d'application ? Parce que faire une recherche sur une base de données du type Wikipédia limite souvent les résultats à sa langue d'origine. Pourtant des informations pertinentes sont aussi contenues dans les documents écrits dans d'autres langues.
Utiliser les deux techniques en parallèle
En particulier si la recherche concerne une personne ou un événement étrangers. Le scientifique utilise une technique qu'il qualifie de "middle man". C'est-à-dire qu'il fait fonctionner simultanément deux techniques de traduction utilisées généralement pour accéder aux informations contenues sur une base de données et rédigées dans une langue non maîtrisée. La première consiste à traduire sa requête et la page de résultat par exemple via Google Traduction. La deuxième : elle vise à utiliser un moteur de recherche incorporé au site ("Cross Language Information Retrieval") puis traduire la page.
Les documents sont automatiquement traduits
En utilisant ces deux démarches en même temps, le chercheur estime obtenir des résultats plus pertinents, dans le contenu et dans la traduction. Toutes les pages obtenues après une requête passent en effet par un module de comparaison qui fait ressortir les documents ayant le plus fort taux de corrélation. Pour réaliser les traductions, Mikhail Basilyan utilise pour le moment Yahoo! Babelfish. La recherche est actuellement limitée à Wikipédia. Mais elle doit être étendue à d'autres bases de données multilingue.

Haut de page

1 Commentaire

il y a encore le nouveau le nouveau outil de google qui représente la mémoire de traduction c'est le toolkit. un nouveau service pour faciliter la traduction de vos documents

Soumis par traducteur anglais (non vérifié) - le 22 juin 2009 à 02h01

Mentions légales © L’Atelier BNP Paribas