La traduction automatique s'étend aux langues anciennes

Par 30 juin 2010 3 commentaires

Pour augmenter la portée des logiciels de traduction statistiques, le MIT et l'université de Californie du Sud proposent de passer par le déchiffrage de langues mortes.

Les systèmes de traduction automatique dits "statistiques", comme celui utilisé par Google Translate, fonctionnent à partir d'un corpus de textes multilingue, et établissent des probabilités à partir de ces données pour traduire ensuite différents documents. Problème : cela limite ces outils à un nombre de langues prédéfini - moins de soixante pour le cas de Google Translate. Deux chercheurs MIT et de l'université de Californie du Sud proposent un modèle permettant d'étendre cette méthode à des centaines d'autres langues. L'outil de traduction qu'ils ont mis au point consiste en effet à déchiffrer automatiquement des documents antiques. Ils l'ont testé avec une traduction d'un ouvrage rédigé en alphabet ougaritique vers l'hébreux. Dans un premier temps, le système intuitif de traduction élabore différentes hypothèses pour définir une cartographie linguistique, basée en partie sur la fréquence des symboles.
Le système examine les cognats des deux langues
Il compare ainsi les symboles revenant le plus fréquemment dans l'une des langues avec ceux récurrents dans l'autre langue. Et prenant également en compte les cognats des langues analysées, c'est-à-dire les mots partageant une structure proche. Il établit ainsi différentes correspondances, en repérant les suffixes ou préfixes, par exemple. A partir de cet examen statistique, il tire un modèle de probabilités. Et cherche à traduire le texte aussi finement que possible. Dans les tests effectués par les scientifiques, le modèle est parvenu à repérer 29 des 30 lettres de l'alphabet ougaritique. Un tiers des mots de cette langue morte ont des cognats en hébreux.
Un outil complémentaire
Le système a automatiquement repéré 60 % d'entre eux. Cette langue avait déjà été traduite auparavant, mais selon les chercheurs, l'outil qu'ils ont mis au point aurait permis de faire gagner du temps aux traducteurs. Qui précisent que ce programme ne vise pas à remplacer d'autres systèmes de traduction, mais à s'intégrer à différents outils pour les compléter. Pour rappel, les universités de Lausanne et de Saarland avaient mis au point un système de traduction intuitive capable de proposer en temps réel une version pertinente d'un texte ou d'un site, en combinant approche sémantique et approche statistique, deux techniques généralement abordées séparément dans le secteur de la traduction automatique.

Haut de page

3 Commentaires

intéressant cet article, il renforce le bien fondé de.

Soumis par video izle (non vérifié) - le 04 juillet 2010 à 14h44

super, dispos en ligne pour test ?

Soumis par manta (non vérifié) - le 01 juillet 2010 à 17h02

Quand on voit à quel point la traduction automatique vers des langues très utilisées, comme l'espagnol, l'allemand, l'italien ou l'anglais, est plus que boiteuse, on peut avoir de très sérieux doute sur celles qui concernent les langues anciennes. Il faut attendre...et espérer.

Soumis par ALAIN MITTOU (non vérifié) - le 09 août 2011 à 23h21

Mentions légales © L’Atelier BNP Paribas