SODA Foundation est un projet open source sous Linux Foundation qui vise à établir un cadre de gestion de données ouvert, unifié et autonome pour la mobilité des données de la périphérie, au cœur et au cloud. Nous avons discuté avec Steven Tan, président de la Fondation SODA, pour en savoir plus sur le projet.
Voici une transcription de l’entretien:
Swapnil Bhartiya: Bonjour, c’est Swapnil Bhartiya, et aujourd’hui nous accueillons Steven Tan, président de la fondation SODA. Tout d’abord, bienvenue au salon.
Steven Tan: Merci.
Swapnil Bhartiya: Parlez-nous un peu de ce qu’est la SODA?
Steven Tan: La fondation est en fait une collaboration entre les fournisseurs et les utilisateurs pour se concentrer sur la gestion des données pour, comment appelez-vous, la gestion autonome du maillage de données. Et le but de tout cela est de savoir comment servir les utilisateurs? Parce que beaucoup de nos utilisateurs sont confrontés à de nombreux défis en matière de données, et c’est à cela que sert cette fondation. Rassembler les utilisateurs et les fournisseurs pour aider à relever ces défis en matière de données.
Swapnil Bhartiya: De quel type de données parlons-nous?
Steven Tan: Les données dont nous parlons font référence à quelque chose comme la protection des données, la gouvernance des données, la réplication des données, la gestion des copies de données et des choses comme ça. Et aussi l’intégration des données, comment connecter les différents silos de données et tout.
Swapnil Bhartiya: C’est vrai. Mais parlons-nous de données d’entreprise ou parlons-nous de données de consommation? Comme il y a beaucoup de données avec Facebook, Google et Gmail, et puis il y a beaucoup de données d’entreprise, quelles entreprises… Désolé, en tant qu’entreprise, je pourrais mettre quelque chose sur ce cloud, je peux le mettre sur ce cloud. Pouvez-vous donc clarifier de quelles données parlons-nous?
Steven Tan: En fait, les données dont nous parlons sont… Cela dépend des utilisateurs. Il y a toutes sortes de données. Comme par exemple, je veux dire, dans le discours d’ouverture que j’ai donné il y a deux jours, l’exemple que j’ai donné venait de Toyota. Le cas d’utilisation de Toyota est donc en fait des données de voiture. Les données de voiture font donc référence à des éléments tels que les données des capteurs de voiture, les vidéos, les données cartographiques, etc. Et puis nous avons des utilisateurs comme China Unicom. Je veux dire, ils ont des entreprises qui se tournent vers le cloud et ainsi de suite. Ils ont donc toutes sortes de données d’entreprise là-bas. Et puis nous avons aussi d’autres utilisateurs comme Yahoo Japan, et ils ont comme un site Web. Les données dont vous parlez sont donc des données Web, des données sur les consommateurs, etc. C’est donc à tous les niveaux.
Swapnil Bhartiya: Oh, donc ce n’est pas aussi spécifique à une industrie ou à aucun espace ou secteur, d’accord. Mais pourquoi en avez-vous besoin? Quel est le problème que vous voyez sur le marché et dans la sphère actuelle où vous vous dites, hé, nous devrions créer quelque chose comme ça?
Steven Tan: Donc le problème qui est venu, je veux dire que la raison pour laquelle toutes ces entreprises se sont réunies est qu’elles construisent des centres de données qui sont de petite à grande. Mais la plupart des défis que vous rencontrez, c’est qu’il est difficile pour un seul projet de répondre. Ce n’est pas comme une entreprise où nous avons un problème spécifique et ensuite nous avons besoin de le résoudre et ainsi de suite, ce n’est pas comme ça. Une grande partie de cela est comme, comment reliez-vous les différentes pièces ensemble dans le centre de données?
Il n’y a donc rien de tel, aucune organisation comme celle-là ne peut les aider à résoudre ce genre de problème. Par exemple, comment avez-vous pour traiter les données de… Ou comment abordez-vous des choses comme la protection des données et la confidentialité des données en même temps? Et en même temps, vous voulez vous assurer que ces données peuvent être gérées correctement. Il n’y a donc pas une seule organisation qui puisse aider à prendre en charge ce genre de choses, donc nous aidons ces utilisateurs à comprendre leurs problèmes, puis à nous rassembler, puis nous planifions des projets et des feuilles de route en fonction de leurs problèmes et essayons de les résoudre. à travers ces projets dans la fondation SODA.
Swapnil Bhartiya: Et vous avez donné un exemple de données sur les voitures et toutes ces choses. Cela signifie-t-il également que l’open source a aidé à résoudre de nombreux problèmes en brisant de nombreux silos afin qu’il y ait beaucoup d’interaction entre différents silos, qui étaient comme auparavant séparés et isolés? Aujourd’hui, comme vous l’avez mentionné, nous vivons dans un monde axé sur les données. Peu importe ce que nous faisons depuis l’Anneau, jusqu’à ce que nous faisons en ce moment, en nous parlant les uns aux autres, jusqu’au produit que nous créerons à la fin. Mais la plupart de ces données vivent dans leurs propres silos. Il peut y avoir beaucoup de valeur dans ces données, qui ne peuvent pas être extraites parce qu’elles sont enfermées dans les silos. Le deuxième problème est que de nos jours, les données sont en train de devenir le prochain pétrole. Ces entreprises essaient de capturer toutes les données, indépendamment du fait de la valeur qu’elles voient dans ces données aujourd’hui? Et en tirant parti de l’apprentissage automatique et de l’apprentissage en profondeur, ils le pourront à l’avenir … Alors, comment voyez-vous cela, et comment la fondation SODA va-t-elle briser ces silos, sans compromettre notre confidentialité, tout en permettant aux entreprises … Parce que le fait est que, comme tout comme je préfère ma vie privée, je veux aussi que Google Maps me dise l’itinéraire le plus rapide où je veux aller.
Steven Tan: C’est vrai. Je pense donc qu’il y a certains, je veux dire, qu’il y a différents niveaux de confidentialité dont nous allons nous occuper. Et pour ce qui est du même genre, tout d’abord, il y a toutes sortes de… Je veux dire, en ce qui concerne les différents pays ou différents États ou différentes provinces comme dans différents pays, il existe différents types de réglementations et ainsi de suite. Alors tout d’abord, comme les silos de données dont vous parlez. Oui, c’est l’un des problèmes clés que nous essayons de résoudre. Comment connecter tous les différents silos de données afin de réduire la fragmentation, puis essayer de minimiser les soi-disant données sombres dont vous parlez, puis extraire toutes les valeurs là-bas. C’est donc l’une des choses que nous essayons d’arriver ici. Je veux dire, nous essayons de connecter toutes les différentes pièces, comme dans les différentes… Les données peuvent se trouver en périphérie dans le centre de données ou dans différents centres de données et dans le cloud. Nous essayons de relier toutes ces pièces ensemble.
Je veux dire, c’est l’une des premières choses que nous avons essayé de faire. Et puis nous avons essayé d’avoir des politiques de données. Je pense que c’est un élément critique auquel beaucoup de solutions ne répondent pas. Vous avez des politiques de données, mais il peut s’agir des politiques de données uniquement pour une solution de fournisseur unique. Mais une fois que les données sont sorties, cette solution est alors incontrôlable. Donc, ce que nous essayons de faire ici, c’est de dire, comment avez-vous des politiques de données dans différentes solutions, de sorte que peu importe où les données se trouvent, elles sont régies de la même manière, de manière cohérente? Voilà la clé. Alors, vous pouvez parler de la façon dont vous pouvez vraiment protéger les données en termes de confidentialité ou régir les données ou contrôler les données? Et en termes de, j’ai mentionné les régions, n’est-ce pas? Vous savez donc où se trouvent les données, et vous savez de quel type de réglementation il faut prendre soin et vous l’appliquez directement. Voilà comment cela devrait fonctionner.
Swapnil Bhartiya: Quand nous regardons le genre de scénario dont vous avez parlé, je le vois comme double. Premièrement, il y a un problème de technologie et le second, un problème de personnes. Alors, la fondation SODA va-t-elle s’occuper des deux ou allez-vous simplement vous en occuper de l’aspect technologique?
Steven Tan: La partie technologique dont nous parlons, nous essayons de définir en termes d’API et ainsi de suite toutes les politiques de données et ainsi de suite, et essayons d’amener autant d’entreprises à soutenir cela que possible. Et ensuite, la prochaine chose que nous essayons de faire est d’essayer de travailler avec des organisations de normalisation pour essayer d’en faire une norme. Je veux dire, c’est ce que nous essayons de faire ici.
Et puis les aspects gouvernementaux, il y a certaines organisations à qui nous parlons. Comme il y a la CESI, ce sont les organisations chinoises de normalisation électronique dont nous parlons qui essaient de faire évoluer les choses dans leur… En fait, je ne suis pas sûr de la Chine, parce que c’est, je veux dire, nous ne connaissons pas leur sphère d’influence au sein du CSI et ainsi de suite. Et puis pour les normes de l’industrie, il y a [inaudible 00:09:05] et ainsi de suite, nous essayons de travailler avec eux et de faire en sorte que cela fonctionne.
Swapnil Bhartiya: Pouvons-nous parler de l’écosystème que vous essayez de construire autour de la fondation SODA? L’un serait les participants qui contribuent en fait soit au code, soit à la vision, et ensuite à la communauté des utilisateurs qui en bénéficierait réellement?
Steven Tan: Donc, l’écosystème que nous essayons de construire, c’est la partie centrale, qui est en fait le cadre. Donc, le cadre, je veux dire, cette partie sera davantage les fournisseurs de données ou les fournisseurs de stockage qui seront impliqués dans la tentative de construction de cet écosystème. Et puis la partie extérieure, ce que j’appelle la partie extérieure de l’écosystème, ce seront des choses comme les plates-formes. Des choses comme Kubernetes, VMware, tous ces différents fournisseurs, puis le type de réseau dont vous devez vous occuper, comme l’analyse du Big Data, etc.
Et puis pour les utilisateurs, en fait, si vous pouvez voir du comité consultatif des utilisateurs finaux de SODA, je veux dire, c’est là que la plupart de nos utilisateurs participent à la communication. Donc, la plupart de ces utilisateurs, je veux dire, ils viennent de différentes régions, de différents pays et de différentes industries. Donc, nous essayons de servir, je veux dire, quel que soit le participant qui s’intéresse, il peut participer à cette chose. Mais l’essentiel est que, parce qu’ils peuvent provenir d’industries différentes, mais en fait, la plupart des problèmes qu’ils ont sont toujours les mêmes. Il y a donc des points communs entre tous ces utilisateurs.
Swapnil Bhartiya: Nous sommes au milieu de 2020, à cause du COVID-19, tout a ralenti, les choses ont changé. À quoi ressemble votre feuille de route, à quoi ressemble votre plan? La structure, la gouvernance et le plan pour 21 ou fin d’année?
Steven Tan: Nous sommes très, comment appelez-vous cela? Type d’organisation très communautaire ou ciblé. Nous organisons beaucoup de rencontres et d’événements, etc., où nous réunissons les utilisateurs et les fournisseurs, etc., et la communauté en général. Donc, avec cette chose COVID-19, beaucoup de plans ont été bouleversés. Je veux dire, c’est dans le chaos en ce moment. Donc, la plupart des choses sont comme ce que tout le monde fait, se déplacer en ligne. Nous avons donc des webinaires et des trucs, même en ce moment, lorsque nous parlons, nous avons un mini sommet en cours avec l’Open Source Summit North America en ce moment.
Donc pour le reste de cette année, la plupart de nos événements seront en ligne. Nous allons organiser des webinaires et des rencontres, vous pouvez le découvrir sur notre site Web. Et les autres plans que nous avons, c’est que nous allons avoir, nous venons de publier la version fédérale SODA, qui est la version 1.0. Et jusqu’à la fin de cette année, nous allons avoir deux autres versions, la version G et la version H à la fin de cette année. La sortie de G aura lieu en septembre et H est à la fin de l’année. Et nous essayons d’impliquer nos utilisateurs avec des choses comme les tests POC pour le gouvernement fédéral. Parce que chaque version que nous avons, nous essayons de les amener à faire les tests, et c’est ainsi qu’ils essaient de nous fournir des commentaires. Que cela fonctionne pour eux ou comment pouvons-nous améliorer pour que le code fonctionne pour ce dont ils ont besoin.
Swapnil Bhartiya: Génial. Merci beaucoup d’avoir pris votre temps et d’expliquer davantage sur la fondation SODA, et j’ai hâte de vous parler à nouveau car je peux voir que vous avez un pipeline très excitant à venir. Alors merci.
Steven Tan: Merci, merci beaucoup.