Démarrage de la transformation des données Tobiko Ce n’est peut-être pas encore un nom familier, mais vous avez peut-être vu le cofondateur et PDG Tyson Mao sur « Beauty and the Geek » dans les années 1990 et son cofondateur, frère et directeur technique Toby Mao, sur le circuit de speedcubing. (Tous deux ont détenu des records du monde dans le passé et Tyson a cofondé la World Cube Association.) Depuis lors, les frères, avec leur cofondateur Iaroslav Zeigerman a travaillé dans une grande variété d’entreprises, allant d’apple à Airbnb, google et Netflix, où Tyson et Zeigerman se sont rencontrés pour la première fois.

Aujourd’hui, avec Tobiko, ils visent à réinventer la façon dont les équipes travaillent avec les données en offrant un Compatible avec DBT plateforme de transformation des données, avec la populaire plateforme de transformation des données SQLMesh et SQLGlot des projets open source à la base et une interface utilisateur intuitive à faible code pour créer des pipelines de données et des transformations.

La société lance mardi sa plate-forme cloud et annonce un financement total de 21,8 millions de dollars, réparti entre un tour de table de 4,5 millions de dollars et un tour de table de série A de 17,3 millions de dollars dirigé par Theory Ventures. 20Sales, George Fraser, PDG de Fivetran, Boris Jabes, PDG de Census et Jordan Tigani, PDG de MotherDuck, ont également investi dans l’entreprise.

Chez Airbnb, Toby a dirigé la Projet Minerva, la couche sémantique des métriques internes de l’entreprise. En travaillant là-dessus, cependant, il dit qu’il a réalisé que la véritable puissance de Minerva n’était pas la sémantique mais ses capacités de transformation des données.

« Les étapes entre les données brutes et la valeur commerciale réelle – il y a beaucoup de choses qui se passent là-dedans », m’a-t-il dit. « C’est beaucoup de travail acharné. Nous voulions donc construire une entreprise de sémantique, mais nous voulons d’abord résoudre la transformation. Et donc chez Airbnb, j’ai eu une démonstration des outils standard de l’industrie, dbt, et cela m’a donné l’inspiration pour commencer cela. »

Publicité
sqlmesh ui column level lineage
Crédits image : Tobiko

Toby a reconnu la popularité et la fonctionnalité de dbt, qui est devenu une sorte de norme de l’industrie pour la construction. Mais il a fait valoir que ce n’est pas la bonne solution pour toutes les entreprises. « DBT a vraiment été conçu pour accélérer les piles de données des entreprises de série A », a-t-il déclaré. « Nous voulions créer une plateforme de données, un outil de transformation des données, qui pourrait fonctionner dans n’importe quelle entreprise, même à la manière des FAANG. Nous avons donc pris notre expérience, nos connaissances collectives, et construit un système qui s’adapterait à la fois à de grandes quantités de données et à un grand nombre de personnes.

Comme l’explique Zeigerman, au cœur de cette plate-forme moderne se trouve SQLMesh, un outil open source qui permet aux développeurs de créer des pipelines de données avec des outils intégrés pour la transformation des données, les tests et la collaboration. C’est également là qu’intervient l’expérience de l’équipe en sémantique. « SQLMesh comprend SQL, au lieu de le traiter comme un morceau de texte », a-t-il expliqué. Et cette compréhension vient de SQLGlot, que Toby a créé pendant son séjour chez Airbnb. « Cette capacité à comprendre SQL permet d’accéder à un tas de choses qui augmentent considérablement la vitesse de développement et la productivité de l’ingénierie. »

tobiko
Crédits image : Tobiko

Cet outil a permis à Tobiko de vérifier la syntaxe des requêtes SQL, par exemple, avant qu’elles ne soient envoyées à la base de données. Il catégorise et suit également toutes les modifications apportées par les ingénieurs au processus de développement et leur indique s’ils cassent quelque chose par rapport à d’autres ensembles de données et transformations dans le système.

« Nous croyons vraiment que ce sera l’un des premiers outils d’observabilité qui comprendra non seulement que quelque chose s’est cassé, mais aussi pourquoi il s’est cassé, parce que nous comprenons votre code, nous comprenons chaque version de chaque code que vous avez jamais écrit, et nous pouvons lier chaque échec à ce changement », a déclaré Tyson.

observer dashboard
Crédits image : Tobiko

Tobiko offre également aux entreprises la possibilité de créer ce que l’équipe appelle des « environnements de données virtuels » que les développeurs peuvent utiliser pendant la phase de développement et réutiliser ensuite pour d’autres projets (ou même en production).

L’équipe me dit qu’elle cible principalement les équipes d’ingénierie de données en ce moment et qu’elle travaille avec des clients de toutes tailles, y compris des startups licornes. Beaucoup d’entre eux apportent des applications entièrement nouvelles au service, mais comme il est compatible avec dbt, il y a aussi un certain nombre d’utilisateurs de dbt qui ont fait le changement.

5/5 - (219 votes)
Publicité
Article précédentShadow of the Erdtree regorge de nouveau contenu
Article suivant6 choses à faire avant la sortie de la mise à jour Minecraft 1.21

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici