Qu’est-ce qui vient de se passer? Si vous avez déjà regardé une vidéo doublée en anglais et que les lèvres d’un orateur se désynchronisent avec les mots, vous aimerez peut-être le nouveau service de Google. Non seulement il offre des traductions en temps réel, mais il édite également la vidéo afin que les lèvres correspondent étroitement à l’audio traduit.
L’un des nombreux nouveaux produits que Google a dévoilés lors de sa conférence I/O hier était son « Translateur universel » expérimental, qui fait partie de sa poussée d’IA.
L’outil fonctionne en prenant une vidéo source – dans ce cas, une partie d’un cours universitaire en ligne créé en partenariat avec l’Arizona State University enregistré en anglais – et en la traduisant dans une autre langue à l’aide de modèles de traduction de nouvelle génération.
Le produit de Google fait plus que simplement traduire ; il imite également la voix et le ton du locuteur dans la langue traduite. Mais le point culminant est la façon dont la vidéo change les lèvres de l’orateur pour se synchroniser avec la nouvelle langue, même si ce n’est pas encore parfait.
Google affirme que son traducteur universel est un énorme pas en avant dans l’apprentissage de la compréhension, et il a déjà vu des résultats prometteurs avec une augmentation des taux d’achèvement des cours.
Monter une personne dans une vidéo et lui mettre des mots dans la bouche est essentiellement un deepfake, c’est pourquoi Google limite pour l’instant l’accès à son traducteur universel aux partenaires autorisés. Le géant de la technologie a admis que si l’outil peut être extrêmement bénéfique dans de nombreux cas, la technologie sous-jacente peut être utilisée à mauvais escient par de mauvais acteurs.
Google a beaucoup parlé de l’adoption d’une approche éthique de l’IA lors de son événement I/O, comme la création d’outils pour aider les utilisateurs à repérer la désinformation en ligne, le marquage des métadonnées pour les images AI et les garde-fous pour les deepfakes non divulgués. Cela arrive à un moment où le chinois Tencent propose désormais de créer des vidéos deepfake convaincantes de n’importe qui pour 145 $.
Vous pouvez consulter l’intégralité de l’événement I/O de Google ici. En plus de toutes les annonces basées sur l’IA, la société a dévoilé Google Pixel 7a, Pixel Fold et Pixel Tablet.