Interface homme-machine : l'intelligence artificielle appliquée à la traduction

L'entrainement de systèmes d'intelligence artificielle appliqués à la traduction avec terminologie propre permet d'optimiser la traduction automatique.

Index

GearTranslations Internationalisation Marketing de contenu Traduction PME

Interfaz-humano-maquina-Inteligencia-Artificial-aplicada-a-la-traduccion.jpg

Nous avons fait remarquer plus tôt que la traduction automatique nécessite encore une post-édition humaine pour assurer qualité et uniformité des résultats. Le langage est subjectif et un grand volume de données bilingues est nécessaire pour «entrainer» les applications et les systèmes informatiques.

Là où la traduction automatique a le plus de difficultés à donner de bons résultats, c’est dans les traductions spécifiques à un domaine. En d’autres termes, il est possible de faire des traductions basiques, mais on n’obtient pas de bons résultats en ce qui concerne le contenu technique.

Aujourd’hui encore, l’innovation ouvre de nouvelles voies dans les systèmes d’intelligence artificielle appliqués à la traduction afin que celle-ci soit de plus en plus automatisée et avec de meilleurs résultats.

L’intelligence artificielle appliquée à la traduction

Les développements actuels se concentrent sur la génération de moteurs de traduction automatique personnalisés qui permettent d’appliquer la technologie d’apprentissage automatique (ou machine learning) aux bases de données d’expressions et à la terminologie propriétaire pour enseigner à une machine comment améliorer la précision des traductions techniques et spécifiques.

Ainsi, la traduction automatique devient ce que l’on appelle en anglais domain specific translation, c’est-à-dire la traduction spécifique d’un domaine de connaissances. La machine apprend le vocabulaire propre à un domaine, effectue l’analyse et la reconnaissance des termes et gère des bases terminologiques, propres ou externes, pour réaliser des traductions automatiques dans un domaine spécialisé.

MT sur mesure

Au cours des deux dernières années, des entreprises telles que Microsoft, Google ou IBM ont lancé une nouvelle génération de moteurs de traduction automatique neuronale avec adaptation de domaine (Custom MT).

Ces nouveaux systèmes, tels que Microsoft Custom Translate, Google AutoML Translation ou IBM Watson, ont été conçus pour effectuer des traductions avec personnalisation automatique à l’aide de corpus (bases terminologiques) spécifiques au domaine.

Avec cette traduction automatique personnalisée, il est prévu d’utiliser le contenu propre à l’entreprise ou des traductions précédentes dans un domaine pour former des plateformes d’intelligence artificielle afin de:

  • Forcer l’utilisation d’un glossaire : il est défini comment certains noms propres ou ensembles de mots doivent être traduits et un glossaire est construit. Lors de la traduction, le système les détecte, consulte le glossaire et remplace la traduction par le ou les mots appropriés.
  • Personnalisation d’un corpus ou d’une base terminologique : en plus des mots spécifiques, il est également possible d’ajouter au système des phrases ou des fragments de texte provenant de documents spécifiques à l’industrie afin qu’il ait une base d’apprentissage plus large. De cette façon, le système est formé pour adapter et optimiser ce corpus à un domaine spécifique.

Bien entendu, les résultats de ces moteurs de traduction personnalisés doivent encore faire l’objet d’une post-édition et d’un contrôle de qualité humain, mais ils réduisent considérablement le temps et la charge de travail nécessaires à l’éditeur.

La formation de ces systèmes exige beaucoup d’informations et de paires de données bilingues. La plupart des données utilisée étant dans des langues associées à l’anglais, la promotion de cette technologie passe nécessairement par la construction de bases de données avec le reste des paires de langues.

Ainsi, les traductions doivent être considérées comme des données d’entreprise et être, par conséquent, protégées et structurées comme des actifs, car bien que la technologie rende déjà possible la traduction automatique personnalisée, il est, dans la pratique, très complexe pour chaque entreprise de former son propre système, et ce, en raison de la quantité de données requises et des coûts qu’implique de structurer ces données de façon à permettre leur utilisation par le système.

Chez Gear Translations, nous vous facilitons l’identification et l’organisation de vos termes et expressions clés dans la base terminologique et créons des bases de phrases multilingues complètes dans votre bibliothèque de traduction. Nous avançons ensemble !

Grâce à l’intelligence artificielle appliquée à la traduction, vous pouvez désormais optimiser et accélérer vos projets de traduction.