Le PC qui lit sur les lèvres devient polyglotte

Par 09 septembre 2009
Mots-clés : Smart city

Une nouvelle méthode de lecture labiale informatisée comprend différentes langues. Elle a plusieurs buts, notamment améliorer les outils de surveillance vidéo et créer un traducteur pour personnes malentendantes.

Les chercheurs à l'Université d’East Anglia en Angleterre ont déjà travaillé sur des logiciels qui déchiffrent les propos sans entendre la voix. Ce projet de lecture labiale ayant avancé, le système est désormais capable de reconnaître et de comprendre plusieurs langues. Conçu par un groupe de vingt-trois spécialistes bilingues ou trilingues, il identifie avec précision quelle langue parle une personne. Neuf langues sont aujourd'hui reconnues: anglais, français, allemand, arabe, mandarin, cantonais, italien, polonais et russe.
Comprendre la physiologie de la parole
"Nous avons constaté que les gens parlant des langues différentes faisaient des mouvement de lèvres différents, explique Stephen Cox, responsable du projet. Par exemple, les francophones ont tendance à arrondir la bouche, alors que chez les arabophones, ce sont les  mouvements de langues qui prédominent". Pour reproduire plus fidèlement la réalité, les chercheurs cherchent à répondre à plusieurs questions : quelle est la relation entre le mouvement facial et l’intonation ? Comment la langue parlée, la pose de la personne et le contexte du discours influent-ils sur la reconnaissance labiale ?
S'adapter à la manière de parler des individus
La prochaine étape dans le développement du projet sera de rendre le système capable de s’adapter à la physiologie individuelle et à la manière de parler de chacun. Le but étant de développer des outils et des techniques qui permettent le déchiffrage automatique des propos des personnes filmées. L'invention pourra trouver ses usages auprès des personnes malentendantes, mais aussi des services de police et de l'armée.

Mentions légales © L’Atelier BNP Paribas