Lors de l’atelier sur la traduction automatique (WMT), l’un des plus grands événements de recherche sur la traduction automatique, Samsung Electronics a rejoint les rangs des chercheurs du monde entier pour discuter de façons nouvelles et innovantes de comprendre le langage humain à l’aide de machines et de programmes informatiques.
Samsung Research et Samsung R&D Institute Poland (SRPOL) ont participé à un concours entre groupes scientifiques et laboratoires pour comparer la qualité de leurs outils de traduction. Des équipes du monde entier ont participé aux huit concours de tâches de traduction automatique, allant de celles représentant des entreprises largement connues à des groupes de recherche de diverses universités.
Le laboratoire de langues du Samsung Research Global AI Center a participé à la tâche de traduction biomédicale, qui vise à évaluer les systèmes de traduction de phrases du domaine biomédical. La tâche portait sur un total de 14 paires de langues, dont l’anglais, le français, l’allemand et l’espagnol. L’équipe a remporté le premier prix pour la traduction efficace de deux paires de langues : anglais → espagnol et espagnol → anglais. Ce fut un exploit particulièrement impressionnant en raison de l’utilisation fréquente de la terminologie du domaine dans le domaine biomédical.
Dans le cas d’une traduction spécifique à un domaine, l’un des principaux facteurs qui déterminent la qualité de la traduction est la traduction terminologique. Même avec le même mot, le mot traduit peut varier selon le domaine, et par rapport aux termes généraux, les termes techniques sont moins fréquemment utilisés, ce qui rend leur apprentissage difficile. Compte tenu de ces limitations, le laboratoire de langues du Samsung Research Global AI Center a amélioré les performances de traduction spécifiques à un domaine en incorporant une traduction terminologique à contraintes souples, qui fournit les contraintes terminologiques de la langue cible en entrée avec des phrases source comme un indice, et a amélioré la terminologie du domaine à reflète autant que possible dans les résultats de la traduction. Actuellement, Samsung Research mène des recherches sur la traduction spécifique à un domaine, notamment en fournissant un service de traduction de brevets (coréen—anglais) sur le service de traduction « SR Translate » de Samsung Research (https://translate.samsung.com).
SRPOL a également participé à deux tâches de traduction automatique générale, obtenant des classements élevés en se classant deuxième pour anglais → russe et anglais → croate.
Pendant les compétitions, WMT ne fournit aux équipes qu’un nombre limité de corpus, des collections de textes structurés, à analyser pour leur modèle de traduction. Par conséquent, l’équipe SRPOL a attribué son succès à l’amélioration de la qualité des corpus grâce à des processus tels que le prétraitement et le filtrage des données. De plus, l’équipe s’est concentrée sur l’optimisation de l’architecture de son modèle et du processus de formation à l’IA.
À l’aide du corpus amélioré, l’équipe de traduction automatique de SRPOL a construit un classificateur à l’aide d’un cadre d’apprentissage automatique appelé BERT (Représentations d’encodeurs bidirectionnels à partir de transformateurs). Ce classificateur a classé avec succès des millions de phrases du corpus dans différents domaines. En conséquence, SRPOL a pu créer des modèles non seulement pour la traduction générale mais aussi médicale et juridique.
SRPOL a obtenu de bons résultats dans le domaine de la traduction automatique, remportant les défis de l’International Workshop on Spoken Language Translation (IWSLT), l’un des ateliers les plus anciens au monde sur la traduction automatique, pendant quatre années consécutives de 2017 à 2020.
Aujourd’hui plus que jamais, l’objectif d’atteindre un niveau humain de compréhension du langage semble être à notre portée. Alors que la traduction automatique et la compréhension des langues deviennent lentement partie intégrante de notre vie quotidienne, Samsung restera à la pointe de cette technologie pour concevoir les outils permettant de surmonter les barrières linguistiques et d’améliorer votre vie quotidienne.
->Google Actualités