Dans la salle des machines qui alimente son service de recherche dominant, Google a récemment activé un nouvel outil puissant.
Selon le géant de la recherche, la nouvelle technologie – un modèle d’IA à grande échelle connu sous le nom de MUM – pourrait un jour transformer la recherche sur Internet en un service beaucoup plus sophistiqué, agissant comme un assistant de recherche virtuel alors qu’il passe au crible le Web pour trouver des solutions à des questions complexes.
Mais les critiques de l’entreprise préviennent que cela comporte un risque clair : cela accélérera un changement qui a déjà vu Google fournir des réponses plus directes aux requêtes des utilisateurs, se plaçant devant d’autres sites Web pour « internaliser » le trafic de recherche et garder les internautes verrouillés. dans un univers Google.
MUM – abréviation de modèle unifié multitâche – est la dernière d’une série de mises à niveau en coulisses du moteur de recherche Google qui, selon la société, ont apporté des changements importants dans la qualité de ses résultats.
Il s’agit notamment de l’introduction, il y a dix ans, d’un « graphe de connaissances » qui définissait la relation entre différents concepts, apportant un degré de compréhension sémantique à la recherche. Plus récemment, Google a cherché à appliquer la dernière technologie d’apprentissage en profondeur pour améliorer la pertinence de la recherche avec un outil appelé RankBrain.
« Nous pensons que nous sommes à la prochaine étape importante », a déclaré Pandu Nayak, le chercheur de Google en charge de MUM.
Google a donné le premier aperçu de la nouvelle technologie lors de sa conférence annuelle des développeurs en mai, bien qu’il ait dit peu de choses sur la façon dont le système pourrait être utilisé. Dans une interview maintenant, Nayak a déclaré que MUM pourrait un jour gérer bon nombre des « besoins d’informations floues » que les gens ont dans leur vie quotidienne, mais qu’ils n’ont pas encore formulés en questions spécifiques qu’ils peuvent rechercher.
Les exemples qu’il donne sont lorsque les parents se demandent comment trouver une école qui convient à leur enfant, ou lorsque les gens ressentent pour la première fois le besoin de commencer un nouveau programme de remise en forme. « Ils essaient de comprendre, qu’est-ce qu’une bonne routine de remise en forme – une qui est à mon niveau ? » il a dit.
En utilisant les moteurs de recherche d’aujourd’hui, « vous devez réellement convertir cela en une série de questions que vous demandez à Google pour obtenir les informations que vous souhaitez », a déclaré Nayak. À l’avenir, suggère-t-il, cette charge cognitive sera supportée par la machine, qui assumera ce qu’il appelle « des besoins des utilisateurs beaucoup plus complexes et peut-être plus réalistes ».
Il a ajouté qu’à terme, les applications de MUM devraient s’étendre bien au-delà de la recherche. « Nous le considérons comme une sorte de plate-forme », a-t-il déclaré.
MUM est le dernier exemple d’une idée qui a balayé le domaine de l’IA en langage naturel. Il utilise une technique appelée transformateur, qui permet à une machine de regarder les mots dans leur contexte plutôt que comme des objets isolés à faire correspondre grâce à une analyse statistique massive – une percée qui a fait un bond dans la « compréhension » de la machine.
La technique a été développée pour la première fois chez Google en 2018, mais sa démonstration la plus spectaculaire est survenue l’année dernière GPT-3, un système développé par OpenAI qui a choqué beaucoup dans le monde de l’IA avec sa capacité à générer de gros blocs de texte cohérent.
Jordi Ribas, responsable de l’ingénierie et des produits du moteur de recherche Bing de Microsoft, a déclaré que cela avait déclenché une « course parmi toutes les entreprises de haute technologie pour sortir des modèles plus grands qui représentent mieux le langage ».
Lorsque Microsoft a dévoilé son modèle de génération de langage Turing au début de l’année dernière, il a affirmé qu’il s’agissait du plus grand système de ce type jamais construit. Mais GPT-3, dévoilé des mois plus tard, était dix fois plus gros. Google n’a pas publié de détails techniques pour MUM, mais a déclaré qu’il était « 1 000 fois plus puissant » que BERT, son premier modèle expérimental utilisant des transformateurs.
Cependant, même avec cet énorme bond en avant, Google fait face à un défi de taille. Les sociétés de recherche ont rêvé de répondre à des questions complexes au cours des 15 dernières années, mais ont trouvé que le problème était beaucoup plus difficile que prévu, a déclaré Sridhar Ramaswamy, ancien chef de l’activité publicitaire de Google et aujourd’hui PDG de la start-up de recherche Neeva.
« Il y a tellement de variations dans tout ce que nous faisons de compliqué », a déclaré Ramaswamy. « Essayer de faire en sorte que le logiciel comprenne ces variations et nous guide s’est avéré incroyablement difficile dans la pratique. »
Le premières utilisations de MUM impliquent des tâches de recherche en coulisses telles que le classement des résultats, la classification des informations ou l’extraction de réponses à partir de texte.
La difficulté de mesurer objectivement la qualité des résultats de recherche rend difficile de juger de l’impact d’efforts comme celui-ci, et de nombreux experts se demandent si d’autres nouvelles technologies de recherche ont été à la hauteur du battage médiatique. Greg Sterling, un analyste de recherche chevronné, a déclaré que de nombreux utilisateurs de recherche n’auront pas remarqué beaucoup d’amélioration et que les recherches de produits en particulier restent très frustrantes.
Les sociétés de recherche, pour leur part, affirment que les tests internes montrent que les utilisateurs préfèrent les résultats des technologies les plus avancées. La capacité d’extraire des réponses à partir de texte a déjà permis à Bing d’offrir des réponses directes à 20% des requêtes qu’il reçoit, selon Ribas.
Pour la plupart des gens, l’impact des transformateurs ne se fera probablement sentir que si la technologie entraîne des changements plus visibles. Par exemple, Google affirme que la capacité de MUM à comprendre à la fois le texte et les images – avec la vidéo et l’audio à ajouter plus tard – pourrait conduire à de nouvelles façons de rechercher dans différents types de médias.
Bulletin quotidien
#techFT vous apporte des nouvelles, des commentaires et des analyses sur les grandes entreprises, les technologies et les problèmes qui façonnent ce secteur en évolution rapide par des spécialistes du monde entier. Cliquez ici pour recevoir #techFT dans votre boîte de réception.
Traiter les requêtes les plus « floues » que Nayak a à l’esprit aurait pour résultat que Google glanerait des informations à partir d’un certain nombre d’endroits différents sur le Web pour présenter une réponse beaucoup plus précise à chaque requête très particulière.
« Cela consolide toutes les activités sur les propriétés de Google », a déclaré Sara Watson, analyste principale au cabinet d’études de marché Inside Intelligence. « Tout ce qui apparaît sur cette première page [of search results] peut être tout ce que vous voulez. Un tel système pourrait provoquer un contrecoup de la part des éditeurs du Web, a ajouté Watson.
Google, déjà surveillé par les régulateurs du monde entier, nie avoir l’intention d’utiliser MUM pour garder plus de trafic Web pour lui-même. « Cela ne va pas devenir une question répondant [system]», a insisté Nayak. « Le contenu disponible sur le Web est suffisamment riche pour que donner des réponses courtes n’ait aucun sens. »
Il a également nié que la distillation des résultats de plusieurs recherches en un seul résultat réduirait la quantité de trafic que Google envoie vers d’autres sites Web.
« Mieux vous comprenez l’intention des utilisateurs et présentez aux utilisateurs les informations qu’ils souhaitent réellement, plus les gens reviennent pour rechercher », a-t-il déclaré. L’effet sera de « faire grossir la tarte » pour tout le monde.
La publicité sur le Réseau de Recherche, élément vital de l’activité de Google, pourrait être confrontée à des questions similaires. Réduire le nombre de recherches nécessaires pour répondre à la question d’un utilisateur peut réduire l’inventaire publicitaire que Google peut vendre. Mais, a déclaré Watson, « si la requête peut être plus complexe et ciblée, l’annonce le peut aussi. Qui fait [ads] valeur beaucoup plus élevée et modifie potentiellement le modèle de tarification.
Les principales avancées de Google en matière de recherche au fil des ans
Recherche universelle – 2007
Google va au-delà de l’affichage de « dix liens bleus » pour renvoyer des images et d’autres résultats
Extraits en vedette – 2009
Les résultats de texte court commencent à apparaître dans une zone en haut de la page de résultats, provoquant la colère de certains éditeurs
Recherche vocale – 2011
Les utilisateurs peuvent parler à Google pour la première fois
Graphique des connaissances – 2012
Google crée un réseau de connexions entre différentes idées, produisant des réponses factuelles directes aux requêtes
RangBrain – 2015
Applique les dernières avancées de l’IA des réseaux neuronaux pour rendre les résultats de recherche plus pertinents
MAMAN – 2021
Apporter un niveau de compréhension plus profond à de nombreuses tâches de recherche, promettant des réponses utiles aux requêtes complexes