Avis de l’éditeur : En tant que musicien électronique de longue date (et ancien rédacteur en chef des magazines Electronic Musician et Music Technology), j’ai toujours été amoureux des synthétiseurs musicaux. Tirant parti d’un ensemble spécialisé de circuits, ces instruments sont conçus pour générer une énorme gamme de sons intrigants à partir d’un matériau sonore brut relativement basique. À bien des égards, les outils d’IA génératifs en croissance rapide d’aujourd’hui présentent des ressemblances intéressantes en ce sens qu’ils peuvent synthétiser un contenu très impressionnant à partir de combinaisons de simples « jetons » ressemblant à des mots (bien que des milliards d’entre eux !). Les outils d’IA générative sont, dans un sens très réel, des synthétiseurs de contenu.

La dernière entrée dans la mêlée de synthèse de contenu vient de Google, qui apporte une gamme impressionnante de de nouvelles capacités sur le marché via des mises à jour de Google Cloud et de sa suite de productivité Google Workspace (Workspace, anciennement connu sous le nom de G Suite se compose de Gmail, Google Calendar, Google Drive, Google Docs et Google Meet).

Après avoir laissé Microsoft attirer l’attention ces dernières semaines avec son partenariat OpenAI ChatGPT – au point que des articles remettant en question les ambitions de Google en matière d’IA générative ont même commencé à apparaître – il est clair que l’entreprise a longtemps été perçue comme un leader de l’IA. ne s’est pas reposé sur ses lauriers. Les débuts d’aujourd’hui offrent un ensemble complet d’applications, de services et de nouvelles approches intéressantes qui montrent clairement que Google n’a pas l’intention de céder le marché de l’IA générative à qui que ce soit.

La société a dévoilé plusieurs nouvelles fonctionnalités pour Google Cloud, une nouvelle Générateur d’applications d’IA générative pour les développeurs professionnels, les fonctionnalités à venir pour toutes les applications de productivité dans Google Workspace, la suite Maker pour les « développeurs citoyens » moins expérimentés, une nouvelle Palmier grand modèle de langue (LLM) et la capacité d’intégrer des applications tierces et des LLM dans sa collection d’offres.

Franchement, c’est une quantité écrasante d’informations à assimiler dans un seul cadre, mais cela prouve, à tout le moins, que beaucoup de gens chez Google y travaillent depuis longtemps.

Publicité

YouTube video

Cependant, toutes les fonctionnalités ne seront pas disponibles immédiatement. Google a présenté une vision de certaines choses qu’il a maintenant et a partagé où il se dirigeait à l’avenir, mais dans le marché incroyablement dynamique qu’est l’IA générative, l’entreprise s’est clairement sentie obligée de faire une déclaration.

Certains des aspects les plus intéressants de la vision de Google pour l’IA générative concernent l’ouverture et la capacité de collaborer avec d’autres entreprises. Par exemple, Google a évoqué l’idée d’un « zoo » modèle de fondation où différents LLM pourraient être connectés à différentes applications. Ainsi, par exemple, bien que vous puissiez certainement utiliser le texte PaLM (Pathways Language Model) ou les modèles de chat PaLM récemment mis à niveau de Google dans les applications d’entreprise via des appels API, vous pouvez également utiliser d’autres LLM tiers ou même open source à leur place.

Le degré de flexibilité était impressionnant avec différents LLM, même si je ne pouvais pas m’empêcher de penser que les services informatiques des entreprises pourraient rapidement commencer à être submergés par la gamme de choix qui seraient disponibles. Compte tenu des exigences inévitables en matière de tests et de conformité, il pourrait être utile de limiter le nombre d’options que les organisations peuvent utiliser (au moins au début).

Google a tenu à souligner que les organisations pouvaient intégrer leurs propres données en plus des LLM de Google pour les personnaliser en fonction des besoins uniques d’une organisation. Par exemple, les entreprises pourraient ingérer certains de leurs propres contenus originaux, images, styles, etc., dans un LLM existant, et ce modèle personnalisé pourrait ensuite être utilisé comme moteur d’IA générative de base pour les applications de synthèse de contenu d’une organisation. Ces personnalisations pourraient s’avérer particulièrement attrayantes pour de nombreuses organisations.

Docs Web 030823

Il y a également eu de nombreuses annonces concernant les partenariats que Google a avec une variété de fournisseurs différents, des startups d’IA peu connues comme AI21Labs et Osmo aux développeurs en plein essor, tels que le fabricant d’outils de génération de code Replit ou les développeurs LLM Anthropic et Cohere. Du côté des images génératives, ils ont souligné le travail avec Midjourney, qui permet non seulement la création initiale d’images via des descriptions textuelles, mais également des modifications et des améliorations basées sur le texte.

Google a également mis l’accent sur la personnalisation des modèles existants. L’entreprise a montré comment les individus pouvaient ajuster différents paramètres de modèle dans le cadre de leur requête initiale pour définir le niveau de précision, de créativité et plus qu’ils pouvaient attendre de la sortie. Malheureusement, dans le style classique de Google, des termes très spécifiques à l’ingénierie ont été utilisés pour certains de ces paramètres, ce qui ne permet pas de savoir si les utilisateurs réguliers seront réellement capables de les comprendre. Cependant, le concept sous-jacent est génial et, heureusement, le libellé des paramètres peut être modifié.

Certes, d’autres outils d’IA génératifs ont montré ce type de capacités, mais l’interface utilisateur et le modèle d’expérience globale présentés par Google semblaient très intuitifs.

Certaines des démos de contenu les plus intéressantes illustrées par Google pour Workspace impliquaient la possibilité de modifier le contenu existant (par exemple, d’un ton écrit plus formel à un ton plus décontracté) ou d’extrapoler à partir d’une invite de saisie relativement limitée. Certes, d’autres outils d’IA générative ont déjà montré ce type de capacités, mais l’interface utilisateur et le modèle d’expérience globale que Google a montrés semblaient très intuitifs.

YouTube video

Parmi les principales fonctionnalités d’IA à venir dans Workspace, Google met en avant :

  • rédiger, répondre, résumer et hiérarchiser votre Gmail
  • réfléchir, relire, écrire et réécrire dans Docs
  • donnez vie à votre vision créative avec des images, du son et de la vidéo générés automatiquement dans Slides
  • passer des données brutes aux informations et analyses via la saisie semi-automatique, la génération de formules et la catégorisation contextuelle dans Sheets
  • générer de nouveaux arrière-plans et capturer des notes dans Meet
  • activer les flux de travail pour faire avancer les choses dans Chat

En plus des logiciels, Google a abordé le côté matériel de l’infrastructure Google Cloud qui est capable de prendre en charge tous ces efforts pour Vertex AI et Workspace. La société a noté combien de ces charges de travail sont alimentées par diverses combinaisons de leurs propres TPU ainsi que par les puissants GPU de Nvidia. Alors qu’une grande partie de l’attention portée aux applications d’IA génératives n’a porté que sur les logiciels, il ne fait aucun doute que les innovations matérielles dans le domaine des semi-conducteurs et des serveurs continueront d’avoir un impact important sur les développements de l’IA.

Pour en revenir à l’analogie du synthétiseur, les progrès des LLM que les nouvelles offres de Google mettent en évidence à bien des égards reflètent la diversité des différents moteurs sonores et architectures utilisés pour les concevoir. Tout comme il existe de nombreux types de synthétiseurs, les principales différences provenant du matériau source brut utilisé dans le moteur sonore et du flux de signal à travers lequel ils procèdent, je m’attends également à voir plus de variété dans les LLM fondamentaux. Il y aura probablement une diversité de matériaux sources utilisés pour divers modèles et différentes architectures à travers lesquels ils seront traités. De même, le degré de « programmabilité » variera probablement un peu aussi, d’un nombre modeste d’options prédéfinies à la flexibilité complète (mais potentiellement écrasante) de la modularité – tout comme on le trouve dans le monde des synthétiseurs.

En termes de disponibilité, bon nombre des nouvelles fonctionnalités de Google sont initialement limitées à un ensemble de testeurs de confiance, et les prix (et même les options d’achat) de ces services ne sont toujours pas annoncés.

Pour les utilisateurs réguliers, certains des outils de génération de contenu textuel dans Docs et Gmail seront probablement le premier aperçu de l’IA générative pilotée par Google que beaucoup sont susceptibles de découvrir. Et comme Microsoft, les futures itérations et améliorations viendront sans aucun doute à un rythme très rapide.

Il ne fait aucun doute que nous sommes entrés dans une nouvelle ère extrêmement passionnante et compétitive dans le domaine de l’informatique d’entreprise et du monde technologique en général. Les outils d’IA générative ont suscité une gamme époustouflante de nouvelles applications potentielles et d’améliorations de la productivité que nous commençons tout juste à comprendre. Comme pour de nombreuses grandes tendances technologiques, la surmédiatisation est inévitable. Cependant, il est également clair que Google a maintenant fermement placé un enjeu dans le monde en évolution rapide des outils et services d’IA générative. Ce qui se passera ensuite n’est pas clair, mais ça va être incroyablement excitant à regarder.

Bob O’Donnell est le fondateur et analyste en chef de TECHnalysis Research, LLC une société de conseil en technologie qui fournit des services de conseil stratégique et d’étude de marché à l’industrie technologique et à la communauté financière professionnelle. Vous pouvez le suivre sur Twitter @bobodtech.

Rate this post
Publicité
Article précédentStudio Ghibli ouvrira un parc à thème pour les fans d’anime, y compris Spirited Away land
Article suivantLa lutte LCA établit une dynastie – The Xenia Gazette
Avatar
Violette Laurent est une blogueuse tech nantaise diplômée en communication de masse et douée pour l'écriture. Elle est la rédactrice en chef de fr.techtribune.net. Les sujets de prédilection de Violette sont la technologie et la cryptographie. Elle est également une grande fan d'Anime et de Manga.

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici