La mémoire textuelle de l'entreprise forme un dictionnaire haut de gamme

Par 29 mai 2008
Mots-clés : Smart city

Lingua-et-Machina développe un système qui puise dans l'ensemble des écrits de l'entreprise pour proposer aux salariés des traductions plus précises des textes qu'ils doivent rédiger.

Pour envoyer un mail technique ou dans une langue étrangère en entreprise, il est possible de faire appel à des outils de traduction automatique et autres dictionnaires. Des outils qui fournissent des versions parfois aléatoires et peu précises. Lingua-et-Machina souhaite répondre à ce problème : elle travaille sur Libellex, une solution de gestion de l'écrit qui s'appuie sur la mémoire textuelle de l'entreprise. La start-up part du constat suivant : les salariés d'un même secteur partagent un langage commun. En allant puiser dans une base de données contenant tous les échanges écrits, il est tout à fait envisageable de trouver la traduction ou la formulation de mots ou de groupes de phrase correspondant exactement à la demande de la personne en train de rédiger un message. Concrètement, le logiciel part de l'ensemble des traductions déjà réalisées par l'entreprise. Des règles d'analyse grammaticale et syntaxique sont ensuite réalisées sur chacun des textes - l'original et la traduction.
Un corpus parallèle
Le système est alors chargé de déterminer quelle phrase dans une langue correspond à quelle autre dans la langue d'envoi du document. Ce, quel que soit l'ordre des mots et l'orthographe : Libellex est censé reconnaître les fautes. Enfin, chaque paire de mots, de groupes de mots ou de phrases est stockée dans la base de donnée. Quand le salarié rédige un texte, chacun des mots, s'il le souhaite, peut être comparé à la base afin de lui proposer des traductions pertinentes. Le système fonctionne pour le moment en sept langues, dont le français, l'anglais, l'allemand et l'espagnol. Point intéressant : il est évolutif. Chaque nouveau texte enrichit la mémoire. Les traductions proposées au salarié sont censées être justes, puisqu'elles ont déjà été utilisées par l'entreprise. Un système de notation est cependant mis à disposition des utilisateurs, afin d'affiner le programme.
Sécurité et confidentialité en ligne de mire
Reste la question de la sécurité. Une base de données contenant toute la mémoire des échanges d'une organisation est une cible idéale à pirater. "Le serveur est monté dans l'entreprise et est accessible en Intranet. La DSI contrôle donc la sécurité au même titre que les autres applications gérées en interne", explique à L'Atelier François Brown de Colstoun, président de Lingua-et-Machina. Le risque semble donc n'être pas plus élevé que pour les autres données de l'entreprise. Mais il est difficile de l'annihiler totalement. Autre problème : celui de la confidentialité du contenu des textes qui se retrouvent dans la base. Pour le responsable de Lingua-et-Machina, le problème ne se pose pas : il n'est pas possible d'accéder à un texte dans son ensemble mais seulement de profiter de mots et de groupes de mots sortis de leur contexte. Le prix moyen d'installation est de 15 000 euros pour un grand compte, un peu moins pour une PME. A noter : Libellex est la deuxième solution logicielle pour les entreprises développée par Lingua-et-Machina. La première, Similis, s'adresse plutôt aux traducteurs professionnels.

Mentions légales © L’Atelier BNP Paribas