La capacité de ChatGPT à répondre aux questions de manière conversationnelle et directe a conduit certains à proclamer que le chat IA tuera le moteur de recherche traditionnel. Google répond sérieusement à cela et, d’après ce qu’il a déjà montré, devrait être plus que capable de rivaliser. La question est l’expérience utilisateur.

Questions et réponses

Fondamentalement, la mission de Google « d’organiser l’information mondiale et de la rendre universellement accessible et utile » peut être divisée en deux volets.

Les utilisateurs posent des questions et Google fournit des réponses. Les requêtes – d’abord des mots-clés, puis des questions formulées naturellement – étaient à l’origine tapées dans une boîte et plus tard, elles étaient prononcées. Les réponses ont commencé par des liens vers des sites Web susceptibles de contenir des informations pertinentes, mais elles ont également évolué.

Google a commencé à fournir des réponses immédiates à des questions plus simples qui sont plus ou moins des faits, en utilisant des informations provenant de bases de données, de listes et, le plus souvent, de Wikipedia. Ce passage aux réponses directes coïncide avec le fait que les smartphones, et leurs écrans relativement plus petits, deviennent le principal appareil. Puis sont venus les appareils portables et autres appareils audio comme les haut-parleurs et les écrans intelligents.

Publicité

Il n’est pas facile de répondre à d’autres questions, mais Google essaie toujours d’utiliser quelque chose appelé un extrait en vedette, ou des citations directes d’un site Web qui, selon lui, répondra à votre question. Ces dernières années, Google a été critiqué pour ces Snippets de toutes parts. Il choisit parfois de citer une source qui est manifestement fausse, tandis que les propriétaires de ce contenu reprochent à Google d’avoir volé des clics de manière complotiste pour garder les utilisateurs sur la recherche.

Ce même type de question complexe est quelque chose qui ChatGPT excelle en étant capable de générer la réponse pour beaucoup de choses au lieu de vous envoyer ailleurs. Les premiers utilisateurs ont compris cela et pensent que l’avenir de la recherche impliquera d’obtenir des réponses directes tout le temps grâce à un va-et-vient avec la possibilité de demander des suivis. En fait, ChatGPT est également capable de poser des questions pour vous amener à clarifier votre requête si nécessaire. Pendant ce temps, il peut également déboguer du code, rédiger des essais (avec la possibilité de spécifier des paragraphes), résumer, expliquer et bien plus encore.

Ce que Google a |

LaMDA

Google travaille depuis un certain temps sur la même technologie de modèle linguistique qui sous-tend ChatGPT, quoique de manière moins flashy. Cela dit, il a donné son travail sur la compréhension du langage naturel (NLU) et la facturation centrale des grands modèles de langage aux E/S pour deux conférences de développeurs consécutives maintenant.

LaMDA (Language Model for Dialog Applications) est « l’IA conversationnelle la plus avancée de Google à ce jour ». Il a été dévoilé aux I/O 2021 « pour converser sur n’importe quel sujet », avec la mise en garde qu’il était encore en phase de R&D. Les exemples de Google de parler à la planète Pluton et à un avion en papier visaient à démontrer comment LaMDA a « repris plusieurs des nuances qui distinguent la conversation ouverte », y compris des réponses sensibles et spécifiques qui encouragent d’autres allers-retours.

Les autres qualités recherchées par Google sont «l’intérêt» (que les réponses soient perspicaces, inattendues ou pleines d’esprit) et la «factualité», ou s’en tenir aux faits.

Un an plus tard, LaMDA 2 a été annoncé et Google a commencé à faire découvrir au public trois exemples spécifiques de LaMDA avec l’application AI Test Kitchen.

MAMAN

Outre LaMDA, Google a mis en avant des modèles multimodaux qui « permettent aux gens de poser naturellement des questions sur différents types d’informations » avec MUM (Multitask Unified Model). Il convient de noter l’exemple de requête proposé par Google auquel un moteur de recherche ne peut pas répondre aujourd’hui, mais c’est quelque chose que cette nouvelle technologie peut résoudre :

J’ai fait de la randonnée sur le mont Adams et je veux maintenant faire de la randonnée sur le mont Fuji l’automne prochain, que dois-je faire différemment pour me préparer ?

MUM comprendrait que vous comparez deux montagnes et que la plage horaire que vous avez fournie correspond à la saison des pluies du mont Fuji, ce qui nécessite un équipement étanche. Cela pourrait faire apparaître des articles écrits en japonais où il y a plus d’informations locales, alors que l’exemple le plus impressionnant était plus ou moins lié à Google Lens :

Alors imaginez maintenant prendre une photo de vos chaussures de randonnée et demander : « Puis-je les utiliser pour faire de la randonnée sur le mont Fuji ? » MUM serait en mesure de comprendre le contenu de l’image et l’intention derrière votre requête, de vous faire savoir que vos chaussures de randonnée fonctionneraient parfaitement, puis de vous diriger vers une liste d’équipements recommandés et un blog sur le mont Fuji.

C’était encore une requête exploratoire, mais plus concrètement, Google a annoncé comment il ajoute MUM à Lens afin que vous puissiez prendre une photo d’une partie cassée de votre vélo (que vous n’êtes pas au courant) et obtenir des instructions sur la façon de le réparer .

Palmier

Si MUM permet de poser des questions avec une variété de supports et que LaMDA peut poursuivre les conversations, PaLM (Pathways Language Model) est ce qui peut répondre aux questions. C’était annoncé en avril et a reçu une mention sur scène à I/O. PaLM est capable de faire :

Réponse aux questions, analyse sémantique, proverbes, arithmétique, complétion de code, connaissances générales, compréhension de lecture, résumé, chaînes d’inférence logique, raisonnement de bon sens, reconnaissance de formes, traduction, dialogue, explications de blagues, AQ physique et compréhension du langage.

Il est alimenté par une architecture d’IA de nouvelle génération appelée Pathways qui peut « former un seul modèle à faire des milliers ou des millions de choses » par rapport à l’approche actuelle hautement individualisée.

Jusqu’aux produits

Lorsque Google a annoncé LaMDA en 2021, Sundar Pichai a déclaré que ses « capacités de conversation naturelles ont le potentiel de rendre l’information et l’informatique radicalement plus accessibles et plus faciles à utiliser ».

Google Assistant, Search et Workspace ont été spécifiquement vérifiés en tant que produits pour lesquels ils espèrent « incorporer[e] de meilleures fonctionnalités conversationnelles. Google pourrait également offrir « des fonctionnalités aux développeurs et aux entreprises clientes ».

Dans ce monde post-ChatGPT, plus de quelques personnes ont déclaré que les réponses directes pourraient nuire au modèle commercial basé sur la publicité de Google, l’idée étant que les gens n’auraient plus besoin de cliquer sur des liens s’ils avaient déjà obtenu la réponse. Dans les exemples fournis par Google, rien n’indique qu’il souhaite cesser de créer des liens vers du contenu.

Il existe de gros problèmes de sécurité et de précision, sur lesquels Google a toujours insisté lors de la démonstration. Le fait que ces modèles « peuvent inventer des choses » semble être le plus gros goulot d’étranglement plus que tout.

En attendant, il n’est pas clair si les gens veulent que chaque interaction avec un moteur de recherche soit une conversation. Cela dit, Google a reconnu en interne que l’approche conversationnelle « répond vraiment à un besoin que les gens semblent avoir ».

Google serait en « code rouge » sur ChatGPT et aurait réaffecté diverses équipes pour travailler sur des produits et des démos d’IA concurrents. Une autre présentation de la technologie à I/O 2023 est plus que probable, mais il reste à savoir si cela signifie que LaMDA, MUM et PaLM seront intégrés de manière proéminente dans les plus grands produits de Google.

En mai, Pichai a réitéré à quel point « la conversation et le traitement du langage naturel sont des moyens puissants de rendre les ordinateurs plus accessibles à tous ». D’après tout ce que l’entreprise a prévisualisé, l’objectif final est de permettre à Google Search de répondre aux questions comme un humain.

Sans surprise, Google a la technologie pour y arriver, mais le défi éternel de l’entreprise est de déplacer la R&D vers des produits réels, et il ne semble pas sage pour le moteur de recherche que le monde ait besoin d’être constamment correct.

FTC : Nous utilisons des liens d’affiliation automatique générateurs de revenus. Plus.

Baseus 750X150

4.7/5 - (4 votes)
Publicité
Article précédentHonkai Star Rail Black Swan : fuites, bande-annonce et plus
Article suivantCryptic Superman Tease suscite des spéculations sur Snyderverse

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici