Il y a plus de 600 millions d’internautes en Inde, mais seule une fraction de cette population parle couramment l’anglais. La plupart des services en ligne et une grande partie du contenu sur le Web actuellement, cependant, sont disponibles exclusivement en anglais.

Cette barrière linguistique continue de contribuer à une fracture numérique sur le deuxième plus grand marché Internet du monde qui a limité des centaines de millions de restitutions d’utilisateurs du World Wide Web à quelques sites Web et services sélectionnés.

Il n’est donc pas surprenant que les géants américains de la technologie, qui comptent sur les marchés émergents comme l’Inde pour poursuivre leur croissance. tentent de plus en plus de rendre le Web et leurs services accessibles à un plus grand nombre de personnes.

Google, qui a jusqu’à présent mené cet effort, a annoncé jeudi une série de changements qu’il déploie dans certains de ses services pour les faire parler plus de langues locales et a dévoilé une toute nouvelle approche pour traduire les langues.

En outre, Google a annoncé son intention d’investir dans l’apprentissage automatique et les efforts d’IA au centre de recherche de Google en Inde et de rendre ses modèles d’IA accessibles à tous dans l’écosystème. L’entreprise – qui compte l’Inde comme son plus grand marché d’utilisateurs, et cette année s’est engagé à investir plus de 10 milliards de dollars dans le pays dans les années à venir – prévoit également de s’associer avec des startups locales qui servent les utilisateurs dans les langues locales et d’améliorer «radicalement» l’expérience des produits et services Google pour les utilisateurs de langue indienne.

Publicité

Changements de produit

Image 1

Les utilisateurs pourront désormais voir les résultats de leurs recherches en tamoul, telugu, bangla et marathi, en plus de l’anglais et de l’hindi actuellement disponibles. L’ajout intervient quatre ans après que Google a ajouté l’onglet Hindi à la page de recherche en Inde. La société a déclaré que le volume de requêtes de recherche en hindi avait augmenté de plus de 10 fois après l’introduction de cet onglet. Si quelqu’un préfère voir sa requête en tamoul, par exemple, il pourra désormais définir l’onglet Tamil à côté de l’anglais et basculer rapidement entre les deux.

Obtenir des résultats de recherche dans une langue locale est utile, mais souvent les gens souhaitent également poser leurs requêtes dans ces langues. Google affirme avoir découvert que taper dans une langue autre que l’anglais est un autre défi auquel les utilisateurs sont confrontés aujourd’hui. «En conséquence, de nombreux utilisateurs effectuent des recherches en anglais même s’ils préfèrent vraiment voir les résultats dans une langue locale qu’ils comprennent», a déclaré la société.

Pour relever ce défi, la recherche commencera à afficher le contenu pertinent dans les langues indiennes prises en charge, le cas échéant, même si la requête dans la langue locale est saisie en anglais. La fonctionnalité, que la société prévoit de déployer au cours du mois prochain, prend en charge cinq langues indiennes: l’hindi, le bangla, le marathi, le tamoul et le télugu.

Image

Google permet également aux utilisateurs de changer rapidement la langue préférée dans laquelle ils voient les résultats dans une application sans modifier les paramètres de langue de l’appareil. La fonctionnalité, qui est actuellement disponible dans Discover et Google Assistant, sera désormais déployée dans Maps.

De même, la fonction Devoirs de Google Lens, qui permet aux utilisateurs de prendre une photo d’un problème de mathématiques ou de sciences, puis fournit sa réponse et guide les élèves à travers les étapes pour y arriver, prend désormais en charge la langue hindi. L’Inde est le plus grand marché pour Google Lens, a déclaré Nidhi Gupta, chef de produit senior chez Google India, lors de l’événement.

Jayanth Kolla, analyste en chef de la société de conseil Convergence Catalyst, a déclaré que la nouvelle fonctionnalité de Google Lens pourrait constituer une menace pour certaines startups indiennes telles que Doubtnut soutenu par Sequoia Capital qui fonctionne dans un espace similaire.

MuRIL

Les dirigeants de Google ont également détaillé un nouveau modèle d’IA de langage, qu’ils appellent Représentations multilingues pour les langues indiennes (MuRIL), qui offre plus d’efficacité et de précision dans la gestion de la translittération, des variations orthographiques, des langues mixtes et d’autres nuances de langues. MuRIL prend en charge le texte translittéré lors de l’écriture de l’hindi en utilisant le script romain, ce qui manquait aux modèles précédents du genre, a déclaré Partha Talukdar, chercheur scientifique chez Google Research India, lors d’un événement virtuel jeudi.

La société a déclaré avoir formé le nouveau modèle avec des articles sur Wikipédia et des textes d’un ensemble de données appelé Common Crawl. Il l’a également formé sur du texte translittéré provenant, entre autres, de Wikipédia (alimenté par les modèles de traduction automatique neuronale de Google). Le résultat est que MuRIL gère mieux les langues indiennes que les modèles linguistiques précédents, plus généraux et peut faire face aux lettres et aux mots qui ont été translittérés – c’est-à-dire que Google utilise les lettres correspondantes les plus proches d’un alphabet ou d’une écriture différent.

Talukdar a noté que le modèle précédent sur lequel Google s’appuyait s’est avéré non évolutif car l’entreprise devait créer un modèle pour chaque langue séparément. «Construire une telle modélisation spécifique au langage pour chaque tâche n’est pas efficace en termes de ressources car nous n’avons souvent pas de données de formation pour des tâches comme celle-ci», a-t-il déclaré. MuRIL surpasse considérablement le modèle précédent – de 10% sur le texte natif et de 27% sur le texte translittéré. MuRIL, qui a été développé par des dirigeants de Google en Inde et est utilisé depuis environ un an, est désormais open source.

Muril Google

MuRIL prend en charge 16 langues indiennes et l’anglais.

L’une des nombreuses tâches dans lesquelles MuRIL est doué est de déterminer le sentiment de la phrase. Par exemple, «Achha hua account bandh nahi hua» serait auparavant interprété comme ayant une signification négative, mais MuRIL identifie correctement cela comme une déclaration positive, a déclaré Talukdar. Ou prenez la capacité de classer une personne par rapport à un lieu: «Shirdi ke sai baba» serait auparavant interprété comme un lieu, ce qui est faux, mais MuRIL l’interprète correctement comme une personne.

Rate this post
Publicité
Article précédentTFT Set 4.5 Leak révèle de nouveaux champions, classes et origines
Article suivantLes joueurs de FIFA 21 utilisent leur propre règle du Golden Goal pour battre le grind Ultimate Team • Fr.techtribune
Avatar De Violette Laurent
Violette Laurent est une blogueuse tech nantaise diplômée en communication de masse et douée pour l'écriture. Elle est la rédactrice en chef de fr.techtribune.net. Les sujets de prédilection de Violette sont la technologie et la cryptographie. Elle est également une grande fan d'Anime et de Manga.

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici