google organise une version de sa conférence Cloud Next à Tokyo cette semaine, et met l’accent sur l’adaptation de ses bases de données aux charges de travail de l’IA (car à ce stade de 2024, l’IA est la seule chose dont ces grandes entreprises technologiques veulent parler). Il s’agit notamment de mises à jour de sa base de données SQL Spanner, qui prend désormais en charge la recherche graphique et vectorielle, ainsi que des capacités de recherche en texte intégral étendues.
Ce ne serait pas une annonce de Google sans certaines fonctionnalités alimentées par Gemini. Il s’agit notamment de Gemini dans BigQuery et de Looker pour aider les utilisateurs dans l’ingénierie et l’analyse des données, ainsi que dans les tâches de gouvernance et de Sécurité.
Google affirme que si la grande majorité des entreprises pensent que l’IA générative sera essentielle au succès de leur entreprise, elles savent également qu’une grande partie de leurs données reste non gérée, ce qui les laisse en dehors du champ d’application de leurs initiatives d’analytique et d’IA.
« Ils doivent vraiment sortir de tous leurs silos et îlots de données existants, et passer à une plate-forme de données multimodale consolidée, couvrant les données structurées et non structurées… [because] GenAI est formidable pour analyser les données non structurées et combiner les données au repos avec leur mouvement de données, donc le traitement des données en temps réel et des données au repos », a expliqué Gerrit Kazmeier, vice-président et directeur général de Google pour les bases de données, l’analytique de données et Looker. L’activation de ce flux de données d’entreprise, a-t-il affirmé, est l’objet d’une grande partie de ces nouvelles fonctionnalités.
Spanner obtient des capacités de graphe et de vecteur
Spanner alimente la plupart des produits de Google comme Search, Gmail et youtube et sa liste de clients comprend Home Depot, Uber, Walmart et d’autres. Et bien que Spanner puisse gérer un volume massif de données, les bases de données vectorielles et graphiques sont une nécessité pour intégrer les données d’entreprise dans les applications GenAI et enrichir les modèles de base existants.
« Ce à quoi nous pensons, c’est à ce qu’il nous faudrait vraiment pour prendre la disponibilité, l’échelle, le modèle relationnel de Spanner, et l’étendre vraiment pour en faire la meilleure plate-forme de données pour les applications GenAI opérationnelles », a déclaré Andi Gutmans, vice-président et directeur général de Google pour les bases de données. Comme de nombreux fournisseurs de bases de données, la première étape pour Google consiste à ajouter des capacités de graphisme à Spanner, en utilisant la norme émergente GraphQL. Les entreprises peuvent ensuite utiliser ce graphique pour augmenter leurs applications GenAI – et les modèles de base qui les alimentent – à l’aide de la génération augmentée de récupération (RAG), qui est actuellement la norme de facto pour ce cas d’utilisation.
Autres nouveautés de Spanner : la recherche en texte intégral et la recherche vectorielle, avec des capacités de recherche vectorielle soutenues par l’algorithme ScaNN de Google. « Avec Spanner Graph, la recherche en texte intégral et la recherche vectorielle, nous avons fait évoluer Spanner, qui n’est pas seulement la base de données la plus disponible, la plus cohérente et la plus évolutive à l’échelle mondiale, mais aussi une base de données multi-modèles dotée de capacités intelligentes qui interagissent de manière transparente pour vous permettre de fournir une nouvelle classe d’applications basées sur l’IA », explique Google.
En plus de ces mises à jour centrées sur l’IA, Spanner reçoit une nouvelle structure de prix facultative. Surnommées « Spanner editions », l’idée ici est de proposer un modèle de tarification basé sur des niveaux qui leur offre plus de flexibilité. Actuellement, les clients de Google Cloud devaient choisir entre une offre à une seule région et une version multi-région, qui offrait également un ensemble de fonctionnalités supplémentaires telles que la réplication.
Bigtable passe au SQL
Google a également annoncé jeudi une mise à jour majeure de Bigtable, la base de données NoSQL de Google pour les données non structurées et les charges de travail sensibles à la latence. Bigtable prend désormais en charge SQL (ou plus précisément, GoogleSQL, le dialecte SQL de l’entreprise), ce qui facilite considérablement l’utilisation du service par pratiquement tous les développeurs.
Auparavant, les développeurs devaient utiliser l’API Bigtable pour interroger leurs bases de données. Actuellement, Bigtable prend en charge environ 100 fonctions SQL.
Oracle sur Google Cloud
Pour les fans de bases de données Oracle, Google leur permettra désormais d’héberger leurs services de base de données Oracle Exadata et Autonomous directement dans les centres de données Google Cloud, et ils pourront lier leurs applications entre Google Cloud et Oracle Cloud. Pour Google, cela signifie plus de charges de travail dans son cloud et pour Oracle, au moins, cela signifie que ces utilisateurs paient toujours leurs frais de licence, même s’ils n’utilisent pas le cloud Oracle.
Autre nouveauté dans Google Cloud : la prise en charge des logiciels open source Apache Spark et Kafka pour la diffusion et le traitement des données, ainsi que la diffusion en continu en temps réel à partir d’Analytique Hub (le service de Google pour le partage sécurisé de données entre les organisations).