À Google Cloud Next 2020 événement virtuel, Google annoncé BigQuery Omni, une extension multi-cloud de BigQuery qui peut s’exécuter dans AWS et Azure.
BigQuery est un entrepôt de données géré et sans serveur disponible sur Google Cloud. Après App Engine, BigQuery a été l’un des premiers services cloud gérés de Google.
Lancée en 2010, BigQuery est la plate-forme d’entrepôt de données cloud la plus populaire dans le cloud public. Il s’agit de l’un des services à la croissance la plus rapide du portefeuille de produits Google Cloud.
BigQuery peut charger des données à partir de diverses sources de données telles que BigTable, Cloud Storage, Google Drive et Cloud SQL. Il prend en charge les formats de données courants, notamment Avro, CSV, JSON, Apache ORC et Apache Parquet.
Au cours de la dernière décennie, BigQuery a évolué pour répondre aux besoins et aux exigences des clients. Il est devenu la base de la création d’applications basées sur les données et les analyses exécutées dans Google Cloud. Les clients peuvent exécuter des requêtes SQL standard intégrées à des algorithmes d’apprentissage automatique sophistiqués pour effectuer des prédictions et une classification sur des ensembles de données existants. Grâce à la fonctionnalité Feuilles connectées, Google Sheets devient l’interface pour analyser des milliards de lignes de données stockées dans BigQuery.
Avec le acquisition de Looker, Google a complété BigQuery avec des outils d’analyse et de visualisation pour créer des tableaux de bord puissants.
La combinaison de BigQuery et Looker est une alternative viable à Amazon Redshift avec Amazon QuickSight et Azure Synapse Analytics avec Microsoft Power BI.
Qu’est-ce que BigQuery Omni?
BigQuery Omni apporte un sous-ensemble de capacités BigQuery à AWS et Azure (à venir bientôt). Il permet aux clients d’utiliser l’expérience utilisateur et l’API familières de BigQuery sans déplacer explicitement les données vers Google Cloud.
Compte tenu des performances et de la rapidité, les clients ont standardisé leur entrepôt de données sur BigQuery. Même si les charges de travail s’exécutent dans d’autres environnements cloud, elles siphonnent les données vers Google Cloud, qui est finalement chargé dans BigQuery pour analyse. J’ai vu de nombreux joueurs SaaS s’exécutant sur AWS et Azure ingérer leurs données de flux de clics, leurs journaux, leurs données transactionnelles et leurs données de télémétrie à partir de diverses sources vers BigQuery pour exécuter des analyses.
Le transfert de données d’autres environnements cloud vers Google Cloud coûte cher. Par exemple, AWS facture 0,09 USD / Go, tandis qu’Azure coûte 0,087 USD / Go pour le transfert de données sortantes. Un portail de commerce électronique fonctionnant sur AWS mais qui ingère les données dans Google Cloud devra dépenser une somme importante pour le transfert de données.
Outre le coût de transfert des données sortantes, il y a une latence impliquée dans le déplacement des données entre les plates-formes cloud. Les clients devront attendre que les données soient transférées dans Google Cloud, puis les charger dans BigQuery avant d’effectuer l’analyse.
BigQuery Omni relève à la fois les défis – coût de transfert de données et latence. Cela rapproche essentiellement le calcul des données au lieu de déplacer les données à calculer. Les clients AWS et Azure peuvent utiliser instantanément une instance BigQuery exécutée dans la même région, la même zone de disponibilité et le même réseau virtuel que leurs charges de travail.
Avec BigQuery Omni, les clients peuvent utiliser un compartiment Amazon S3 ou un conteneur Azure Storage pour collecter les données et la télémétrie pour ingérer et analyser les données sans jamais avoir à déplacer les données en dehors de leur environnement. Les résultats de la requête de BigQuery Omni peuvent être enregistrés dans le compte de stockage local sans mouvement entre les nuages.
Comme Looker a toujours pris en charge AWS et Azure, il continue d’être l’outil de visualisation pour BigQuery Omni.
BigQuery Omni offre flexibilité, avantage de coût et rapidité tout en garantissant la conformité avec les politiques de localisation et de souveraineté des données. Plus important encore, il offre des choix d’entrepôt de données cloud et d’outils d’analyse aux clients.
Étant donné que BigQuery Omni est en version bêta privée, peu de détails ont été partagés par Google. Mais, il est évident que le service ne prend en charge qu’un sous-ensemble de fonctionnalités offertes par BigQuery fonctionnant dans Google Cloud.
Le gros pari sur Anthos commence à porter ses fruits
Annoncé l’année dernière, Anthos est une plate-forme hybride et multicloud gérée de Google. Solidement ancré dans les technologies natives Kubernetes et cloud, Anthos a permis aux clients de Google d’exécuter des clusters Kubernetes gérés dans vSphere, AWS et Azure.
Anthos a été une première dans l’industrie à fournir un service d’infrastructure entièrement géré dans les principaux environnements de cloud public. C’était un risque calculé de Google d’investir dans une plate-forme qui s’exécute dans l’environnement concurrentiel.
Lorsque Thomas Kurian a repris Google Cloud en tant que PDG, il a promis de rencontrer les clients là où ils se trouvent. Anthos livre la vision et la promesse faites par Kurian. Il rencontre littéralement les clients dans leur environnement actuel, même s’il s’agit du gazon du concurrent.
Anthos est un coup de maître de Google. Lorsque l’industrie était sceptique quant à l’engagement de Google envers le cloud et sa capacité à attirer des clients de la concurrence, elle a stratégiquement construit Anthos en tant que plateforme multi-cloud qui fonctionnerait dans une variété d’environnements.
Anthos a apporté l’un des services clés de Google Cloud, Kubernetes Engine, au multi-cloud. Aujourd’hui, Kubernetes est devenu la norme de facto pour exécuter des applications cloud natives modernes. En amorçant Kubernetes Engine via Anthos, Google s’est fermement installé dans le centre de données d’entreprise, les plates-formes cloud concurrentes et les emplacements périphériques 5G basés sur les télécommunications. Cela ouvre des portes à Google pour fournir d’autres services gérés conçus pour fonctionner au-dessus de Kubernetes.
Pensez à Anthos comme un autocollant double face. Un côté est collé à l’infrastructure sous-jacente (vSphere, baremetal, AWS et Azure) tandis que l’autre est destiné aux services gérés et aux charges de travail des clients de Google. Tout ce que Google a à faire est de s’assurer que la face supérieure de l’autocollant est cohérente quelle que soit l’infrastructure sous-jacente qu’elle extrait. Grâce à cette approche, les clients pourront déplacer les charges de travail basées sur Anthos entre les environnements avec moins de friction.
La beauté d’Anthos est qu’il exploite la puissance brute offerte par ses concurrents en termes de calcul, de stockage et de réseau. Si l’écosystème AWS estime que EC2, S3 et VPC sont éprouvés et fiables, Anthos fonctionne exactement sur les mêmes blocs de construction.
Alors qu’Amazon continue de respecter le SLA défini pour chaque service, Google prend en charge la couche d’infrastructure native du cloud qui s’exécute au-dessus de ces éléments de base. Du point de vue d’AWS, Anthos est encore une autre charge de travail, mais pour Google, c’est la plate-forme la plus stratégique fonctionnant silencieusement dans l’environnement de son concurrent, hébergeant certains de ses services gérés et les charges de travail des clients.
Avec Anthos, Google transforme chaque région AWS et Azure en une région étendue de sa plateforme cloud. Deux produits – Anthos GKE et BigQuery – seront à terme disponibles dans presque toutes les régions d’AWS et d’Azure en triplant le nombre de régions Google Cloud.
Semblable à GKE, BigQuery est un produit important pour Google. C’est l’un des services les plus utilisés par les entreprises. Après avoir rendu GKE disponible via Anthos, Google a désormais exécuté l’un de ses services gérés phares, BigQuery, sur Anthos. Ceci n’est qu’un exemple de ce que Google réserve à Anthos.
C’est une question de temps avant que Google ne rende ses principaux services gérés disponibles sur Anthos. Cloud SQL, BigTable, Cloud AI Platform Pipelines, Cloud Run, Dataflow sont quelques-uns des services qui peuvent trouver leur chemin vers Anthos.
Le gros pari de Google sur Anthos commence à porter ses fruits. BigQuery Omni est une première indication du plan ambitieux de Google visant à intégrer certains de ses services gérés aux environnements de cloud hybride et multi-cloud.
.