«L’espace vectoriel inter-langage est une approche révolutionnaire de l’IA L10N, à égalité avec Neural MT.» Andrzej Zydroń CTO chez XTM International
Cette année, XTM International, développeurs de l’entreprise XTM Cloud système de gestion de la traduction, introduit l’Inter-language Vector Space, une technologie qui cartographie les relations entre les mots à travers les langues. Cette technologie d’intelligence artificielle puissante et unique repose sur des quantités gigantesques de données, y compris des lexiques massifs de Big Data, et une exploration de l’Internet complet dans 250 langues, soit plus de 31 000 paires de langues. L’équipe XTM AI s’est appuyée sur les recherches des ingénieurs de Google et de Facebook pour créer une technologie d’IA polyvalente et robuste. L’espace vectoriel évalue la probabilité que deux mots soient les traductions l’un de l’autre, ce qui donne une base de référence principale sur laquelle développer la fonctionnalité de traitement du langage naturel (NLP).
L’intelligence artificielle et le traitement du langage naturel continuent de faire des percées importantes dans les technologies de traduction. Les progrès récents dans le traitement du langage et la modélisation à l’aide de réseaux de neurones ont inspiré la création de la technologie Vector Space. Espace vectoriel inter-langues est un cadre sur lequel les fonctionnalités et fonctionnalités utiles des produits IA peuvent être construites.
Andrzej Zydroń (CTO) l’exprime ainsi: « JEnter-language Vector Space est une approche révolutionnaire de l’IA L10N, à égalité avec Neural MT. Cela marque un changement de paradigme dramatique pour notre entreprise – à partir de ce moment, toutes les fonctionnalités de l’IA PNL à venir proviendront de l’espace vectoriel inter-langues. La magie derrière cette technologie permet le calcul automatique de la probabilité des significations des mots et des phrases dans les langues. Des progrès récents dans le traitement du langage s’appuyant sur des travaux antérieurs chez Google et Facebook ont permis à XTM d’incorporer le composant multilingue dans des calculs basés sur des algorithmes. Ainsi, par exemple, la probabilité d’espace vectoriel pour le couple anglais espagnol «cat» – «gato» est de 73% tandis que pour «chat –fuego» n’est que de 12%. Nous avons hâte que nos utilisateurs fassent l’expérience de son opération magique de première main. »
Espace vectoriel inter-langues dans XTM Cloud
Certaines des activités les plus exigeantes en temps que rencontrent les linguistes sont de simples tâches manuelles pendant le processus de traduction. Par exemple, l’insertion d’éléments en ligne (caractères fictifs) dans des segments traduits implique un travail de fond de la part du linguiste. «Pour transférer des éléments en ligne à partir de la phrase source, le traducteur doit trouver le bon endroit pour les insérer dans le texte cible. Cette tâche purement technique peut être réalisée par l’IA qui, grâce à l’espace vectoriel inter-langues, est capable de suivre la traduction mot par mot. Si un élément en ligne est placé près d’un certain mot dans le texte source, il est plus probable qu’il soit transféré près de la traduction de ce mot dans le texte cible. Cette fonctionnalité aide les traducteurs à prendre les bonnes décisions concernant le placement en ligne. » a expliqué le Dr. Rafał Jaworski, expert en IA linguistique de l’équipe XTM AI.
L’alignement automatique du corpus n’est pas possible sans les données de dictionnaire bilingues, la fonction d’alignement automatique de XTM fait un usage intensif de la technologie Vector Space. Bâtiment terminologie bilingue à partir de fichiers source et cible parallèles existants est un processus à forte intensité de main-d’œuvre qui nécessite un nettoyage manuel de la sortie. L’extraction de terminologie bilingue Vector Space remplace les tâches fastidieuses et répétitives par une automatisation intelligente plus efficace. Ce que les linguistes gagnent, c’est qu’ils peuvent se concentrer sur des traductions créatives plutôt que sur une série de tâches manuelles ou répétitives.
Vous souhaitez en savoir plus sur l’espace vectoriel inter-langues? Connectez-vous au XTM TechTalk épisode pour entendre Andrzej Zydroń (CTO) et Dr. Rafał Jaworski (expert en IA linguistique) parle de divers cas d’utilisation de l’espace vectoriel.
Et après
Les applications immédiates de Vector Space ont été déployées dans les deux dernières versions deCloud XTM. Les fonctionnalités disponibles incluent le placement automatique des lignes en ligne et l’extraction automatique des termes bilingues. Au cours de l’année à venir, nous prévoyons de publier beaucoup plus de fonctionnalités d’IA alimentées par l’espace vectoriel inter-langue.
Êtes-vous curieux d’en savoir plus sur l’espace vectoriel inter-langues et son impact sur vos flux de traduction? Contactez notre équipe XTM AI à info@xtm.cloud
XTM International
XTM International développe XTM, la principale solution de gestion de la traduction (TMS) basée sur le cloud au monde avec des outils intégrés de traduction assistée par ordinateur (TAO) et de révision assistée par ordinateur (CAR). Il est conçu pour être évolutif, flexible et agile, avec des normes ouvertes de l’industrie à sa base.
Axé sur la rationalisation des processus de localisation complexes et des chaînes d’approvisionnement, XTM centralise les actifs de MT pour une collaboration en temps réel, maximisant la réutilisation des traductions. Le système intègre des revues WYSIWYG en contexte, des tests LQA, des traductions alternatives pour la transcréation, une application mobile pour les chefs de projet et une API REST avec des connecteurs prêts à l’emploi pour la plupart des CMS.
Les clients de XTM comprennent de nombreuses entreprises de premier plan au monde, dans une grande variété d’industries. Plus d’informations sont disponibles au Site Web XTM ou pour tester XTM Inter-language Vector Space, inscrivez-vous pour bénéficier d’un Essai de 30 jours de XTM Cloud.