Databricks, le géant de l’analyse et de l’IA, a acquis la société de gestion de données Tabular pour un montant non divulgué. (CNBC rapporte que Databricks Payé plus de 1 milliard de dollars.)

Selon pour le cofondateur de Tabular, Ryan Blue, lui et les deux autres cofondateurs de Tabular, Daniel Weeks et Jason Reid, rejoindront Databricks dans une certaine mesure. Là, ils travailleront à unifier les bases de clients et les communautés de Tabulaire et de Databrick.

« Rejoindre Databricks signifie qu’il y aura plus de contributions de la part de nos nouveaux collègues », écrit Blue dans un billet de blog. [our community] ne change pas. »

Tabular, qui a été fondée par Blue, Weeks et Reid en 2021, propose des produits de gestion de données basés sur Apache Iceberg, un projet développé par Blue and Weeks chez Netflix et ensuite donné à l’Apache Software Foundation. Iceberg est un format open source et performant pour les bases de données qui optimise les tables des bases de données pour le Big Data tout en permettant aux moteurs de données de fonctionner avec les tables.

Iceberg était en concurrence avec Delta Lake de Databricks dans la guerre des formats pour les data lakehouses – des architectures de données conçues pour stocker de grandes quantités de données brutes tout en fournissant des fonctions de structure et de gestion. Bien qu’Iceberg et Delta Lake utilisent tous deux le format de stockage de données Apache Parquet, ils sont incompatibles sur des aspects clés.

Publicité

Bientôt, cependant, Delta Lake et Iceberg convergeront en un seul. Databricks et Tabular s’engagent à travailler à l’élaboration d’une norme commune à la lumière de l’annonce de l’acquisition.

“[We will be] travailler à l’amélioration de la prise en charge d’Iceberg sur l’ensemble de la plate-forme Databricks », a déclaré M. Blue. « Notre objectif est d’améliorer l’interopérabilité afin que vous puissiez profiter du travail incroyable des deux communautés et que vous n’ayez pas à vous soucier du format sous-jacent. »

Le marché des data lakehouses est énorme… selon selon MIT Tech Review, environ 74 % des organisations en ont un – et donc, du point de vue de Databricks, l’intégration de Tabular dans sa famille d’entreprises était probablement le choix évident. Après tout, la réduction du nombre de formats de data lakehouse concurrents (ou, au contraire, les plates-formes prenant en charge plusieurs formats) rend la plate-forme de Databricks plus attrayante pour les entreprises clientes, même si ces formats ne sont pas propriétaires du fournisseur.

Dans un Article de blog co-écrit par le PDG de Databricks, Ali Ghodsi, et l’architecte en chef Reynold Xin, Databricks a l’intention de « travailler en étroite collaboration » avec les communautés d’Iceberg et de Delta Lake pour « apporter l’interopérabilité aux formats eux-mêmes ».

« Cette acquisition souligne notre engagement envers les formats ouverts et les données open source dans le cloud », peut-on lire dans le billet de blog. « C’est un long voyage, qui prendra probablement plusieurs années à réaliser en [the data lakehouse] communautés.

Avant l’acquisition, Tabular, basée à San Jose, avait levé 37 millions de dollars de capital-risque auprès d’investisseurs tels qu’Andreessen Horowitz, Zetta Venture Partners et Altimeter Capital. Databricks indique qu’elle s’attend à ce que l’achat soit conclu au cours du deuxième trimestre 2024, sous réserve des conditions de clôture habituelles.

5/5 - (351 votes)
Publicité
Article précédentGoogle TV obtient de nouvelles chaînes gratuites et l'intégration de NFL Sunday Ticket
Article suivantMosaic lance le système de cartographie mobile Meridian avec laboratoires inertiels intégrés INS – Inside GNSS

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici