Quand les traducteurs automatiques reconnaissent les dialectes

Par 20 avril 2009
Mots-clés : Smart city

Pour optimiser les outils de traduction, le MIT développe un système capable de distinguer les divers dialectes. Ce, à partir de quelques millisecondes de sons enregistrées.

Pour aider les autorités à classifier un dialecte régional lors d'écoutes téléphoniques, et ensuite à optimiser les outils de traduction automatique de manière adaptée, Pedro Torres-Carrasquillo et ses collègues du MIT ont développé un système d'identification qui reconnaît le dialecte selon les sons qu'il identifie. Et qui traduit ainsi plus exactement le sens du contenu. Pour y parvenir, l'équipe du Lincoln Laboratory a d'abord travaillé sur la construction de modèles qui cartographient les fréquences audio des phonèmes, ou sons isolés d'un langage parlé.
Quelques millisecondes suffisent
Ils se sont ensuite tournés vers la construction d'un modèle qui classifie les données, en trouvant des marqueurs de fréquences permettant de les caractériser. " Pour cela, nous étudions comment les petites parcelles de sons sont distribuées sur le spectre de fréquences ", explique le chercheur. Cela, seulement à partir de quelques millisecondes d'enregistrement. C'était l'un des challenges pour que le système soit viable : qu'il soit capable de reconnaître un dialecte sans avoir à analyser une trop grande quantité de données. Difficile, lorsque l'on sait que les différences linguistiques entre dialectes sont souvent très petites.
Saisir la subtilité des dialectes
Par exemple, les voyelles dans un espagnol cubain sont légèrement plus accentuées que celles de l'espagnol portoricain. A l'heure actuelle, les systèmes commercialisés sont uniquement capables de reconnaître environ vingt-neuf langues écrites et quelques langues parlées, de manière générale. Mais aucun ne parvient à reconnaître automatiquement un dialecte oral d'un autre. Ce qui empêche parfois une traduction exacte des termes, dont le sens peut varier d'une région à l'autre.

Mentions légales © L’Atelier BNP Paribas