La traduction automatique a encore de beaux jours face au crowdsourcing

Par 26 mars 2009
Mots-clés : Smart city

Ces solutions de traduction se perfectionnent : en atteste la dernière version des serveurs Systran, capable d'apprendre à partir d'un corpus. Une démarche de personnalisation qui entre en concurrence avec les initiatives de crowdsourcing ?

Systran lance une nouvelle version de ses serveurs de traduction automatique, Systran Enterprise Server. Sa spécificité, c'est qu'elle personnalise la traduction en apprenant de textes déjà traduits par l'entreprise sur un domaine bien précis. Pour y parvenir, elle utilise un moteur dit hybride, qui combine les technologies d'interprétation basées sur des règles avec celles du traitement statistique. Ces dernières permettant au système d'apprendre à partir d'un corpus. Un tel système est intéressant. Mais à l'ère du "crowdsourcing", qui utilise les ressources des internautes pour réaliser une tâche, on peut se poser la question de la pertinence de ce type d'outils. Faire appel à la créativité et à la connaissance des internautes pour traduire un texte permet en effet une compréhension plus fine du contexte.
Statistiques vs Crowdsourcing ?
L'un des exemples les plus parlants étant la traduction de Facebook en plusieurs langues par des internautes. Ou encore celle du livre Harry Potter en chinois en deux jours grâce à une soixantaine de volontaires. Appliquée en entreprise, une plate-forme de "crowdsourcing" pourrait du coup proposer aux salariés de mettre en commun leurs connaissances pour traduire les contenus. Un constat avec lequel Pierre Laporte, directeur R&D chez Systran, n'est pas d'accord. "La traduction automatique est aussi là pour faire gagner du temps à l'humain. En entreprise, les salariés cherchent des outils informatiques notamment parce qu'ils n'ont pas le temps de créer eux-mêmes leur plate-forme de traduction". Et d'ajouter : "Ce qui ne veut pas dire que les solutions communautaires n'existent pas. Mais plus que concurrentes, elles sont complémentaires des solutions de traduction professionnelles".
Vers une intégration des technologies sémantiques
C'est-à-dire que les logiciels d'interprétation automatiques pourraient fonctionner presque en binôme avec des communautés de traducteurs : les contenus produits par les internautes permettant aux systèmes de traduction automatique d'affiner leur degré de compréhension. Et ces derniers donnant la possibilité d'automatiser certains travaux. L'autre grande concurrente de ce logiciel hybride et à laquelle on pense, c'est la sémantique. Ces technologies de contextualisation permettent à la machine de comprendre le sens des données qui circulent. Pour Pierre Laporte, le danger est encore loin : "il n'y a pas aujourd'hui d'applications réelles des technologies sémantiques pour la traduction automatique". Ces solutions pourraient d'ailleurs être intégrées à celles proposées par Systran pour compléter et affiner ses serveurs de traduction. A noter : l'éditeur présente cette septième mouture à l'occasion du salon Documation.

Mentions légales © L’Atelier BNP Paribas