La grande image: Soyons honnêtes. Si on vous demandait de choisir un sujet ennuyeux dans une liste de nouvelles technologies, il ne fait aucun doute que quelque chose appelé « gestion des données d’entreprise » serait l’un de vos meilleurs choix. Après tout, ça ne crie pas exactement sexy ou excitant. Cependant, il s’avère que la capacité à recueillir des informations commerciales significatives à partir d’une multitude de sources de données différentes de manière opportune et sécurisée est importante pour les organisations de toutes tailles.

Ajoutez à cela le fait que les analyses alimentées par l’IA peuvent être exploitées pour générer les informations, et qu’une offre préconfigurée basée sur le cloud peut automatiquement prendre en charge le travail de préparation désordonné, difficile et en coulisse nécessaire pour obtenir ces informations, et les choses commencent à devenir plus intéressantes.

Cloudera est une société de logiciels dédiée à fournir des systèmes de gestion de données d’entreprise. Elle a commencé comme une société de logiciels open source basée principalement sur les outils d’analyse de données volumineuses Apache Hadoop et a fusionné il y a quelques années avec Hortonworks, une autre société axée sur Hadoop.

Généralement considéré comme un chef de file dans les applications de gestion de données à grande échelle, Cloudera continue d’apporter d’importantes contributions à la communauté open source et a été un chef de file dans ses efforts pour créer une plate-forme de lacs de données entièrement ouverte – la tendance la plus en vogue en matière de mégadonnées.

2022 08 17 Image 35

Publicité

Ils viennent également d’annoncer un nouveau CDP One SaaS solution censée offrir toutes ces fonctionnalités. Plus important encore, en raison de la façon dont il est construit, il devrait ouvrir sa plate-forme de données avancée (CDP) à un plus large éventail d’entreprises et à un groupe plus large d’individus au sein de ces organisations.

Pour ceux qui ne savent peut-être pas ce qu’est un lac de données, considérez-le comme une combinaison d’un lac de données, qui est principalement utilisé avec des données non structurées et semi-structurées, telles que du texte, de l’audio, de la vidéo et des images, et un entrepôt de données, qui est le plus couramment utilisé avec des données structurées traditionnelles basées sur des tableaux de nombres, de valeurs, etc.

Un data lakehouse combine essentiellement le meilleur de ces deux mondes en permettant les types de requêtes structurées qui ont été traditionnellement proposées uniquement avec des entrepôts de données aux données non structurées dans les lacs de données. De plus, il permet aux organisations d’effectuer simultanément des analyses sur les deux types de données, ce qui s’avère extrêmement utile pour l’apprentissage automatique et d’autres applications avancées basées sur l’IA.

Aussi génial que cela puisse paraître en théorie, cependant, la vérité est que c’est très difficile à faire. En fait, extraire des informations commerciales significatives à partir de cet ensemble diversifié de données est une tâche qui a généralement été limitée au monde raréfié des scientifiques des données et aux compétences spécialisées qu’ils possèdent. Ces personnes sont très demandées en ce moment, ce qui les rend difficiles à trouver pour de nombreuses entreprises et très coûteux à recruter et à retenir. De plus, les outils nécessaires pour effectuer ce travail, tels que la plate-forme de données Cloudera existante, bien que très puissants, ne sont pas pour les âmes sensibles sur le plan technique.

Concrètement, cela signifie que, alors que les organisations ont désormais plus accès à des ensembles de données potentiellement intéressants et plus volumineux qu’elles n’en ont jamais eu auparavant et que les outils pour exploiter pleinement ces données sont devenus de plus en plus performants, seules les entreprises les plus grandes et les plus sophistiquées sur le plan technique ont pu profiter de cette combinaison incroyablement puissante. De plus en plus d’entreprises, et le marché en général, ont besoin de quelque chose qui puisse apporter ces types d’outils avancés de gestion et d’analyse de données à un public plus large, d’où le lancement de CDP One. C’est l’effort de Cloudera pour apporter les types de capacités et d’outils de gestion de données de ses offres CDP Private Cloud sur site et CDP Public Cloud actuelles à un public plus grand public.

Une partie du problème est que ce n’est pas une chose facile à faire. La gestion des données d’entreprise est restée un sujet obscur pour beaucoup en raison de la quantité de travail et d’expertise nécessaire pour ces types de projets. D’une part, vous devez avoir accès et importer ou « ingérer » les différents ensembles de données avec lesquels vous souhaitez travailler. Comme pour de nombreux aspects du Big Data, le processus d’ingestion de données est quelque chose qui semble simple en théorie mais qui s’avère difficile dans la pratique.

Par exemple, étant donné que les données peuvent provenir de n’importe quelle combinaison de ressources de cloud public, de bases de données sur site, de sorties d’applications SaaS, d’entrées de streaming en temps réel, etc., il peut être difficile de rassembler tous les éléments que les organisations souhaitent analyser. De plus, il s’avère que le format des tables dans lesquelles certains types de données sont stockés est propriétaire, ce qui complique davantage le processus d’ingestion. Pour aider à cela, Cloudera a récemment ajouté la prise en charge de la table de données au format open source Apache Iceberg au CDP, un autre exemple des efforts de l’entreprise pour prendre en charge les normes ouvertes.

De plus, les données doivent souvent être préparées et/ou modifiées pour être prêtes à être manipulées et analysées. Pour ce faire, diverses ressources informatiques, de stockage et de mise en réseau basées sur le cloud peuvent devoir être configurées pour gérer ce travail. De plus, les modèles ML ou AI peuvent devoir être chargés ou ajustés pour commencer le travail d’analyse. Enfin, avant tout, il faut s’assurer qu’aucune donnée n’est accidentellement diffusée, qu’aucune faille de sécurité n’est créée, etc. lors du processus de configuration et d’activation de toutes ces ressources. Respectivement connus sous le nom de DevOps, MLOps et SecOps, ces trois ensembles critiques de fonctions opérationnelles peuvent être parmi les parties les plus consommatrices de temps et de ressources d’un projet d’analyse de données volumineuses. Reconnaissant ce défi, l’un des principaux avantages de CDP One est ce que Cloudera appelle Zero Ops, ce qui signifie qu’il s’occupe de tout ce travail lui-même, ce qui rend le passage à la partie critique de l’analyse des données du processus beaucoup plus facile et plus rapide.

Les outils d’analyse de données eux-mêmes peuvent être un peu intimidants pour tous, sauf les scientifiques de données, les développeurs ou les analystes de business intelligence les plus avancés sur le plan technique. Cloudera s’oriente ainsi vers l’intérêt croissant pour les outils d’analyse et de visualisation low-code et no-code. L’objectif est de permettre même aux utilisateurs professionnels sophistiqués d’exploiter les outils de gestion et d’analyse de données basés sur le cloud de CDP dans leur flux de travail habituel.

En vérité, nous parlons des avantages de l’analyse des mégadonnées depuis ce qui semble être une décennie ou plus maintenant. Ce qui est devenu évident au cours des années qui ont suivi, c’est qu’il est beaucoup plus difficile d’obtenir des résultats utiles à partir de ces efforts que la plupart ne le pensaient (et que la plupart des entreprises et des fournisseurs de technologie sont prêts à l’admettre). Avec CDP One, Cloudera semble faire de grands progrès pour combler cet écart. Cela offre également des opportunités potentiellement intéressantes pour tirer parti des informations importantes de grands ensembles de données à un public beaucoup plus large.

Bob O’Donnell est le fondateur et analyste en chef de TECHnalysis Research, LLC une société de conseil en technologie qui fournit des services de conseil stratégique et d’étude de marché à l’industrie technologique et à la communauté financière professionnelle. Vous pouvez le suivre sur Twitter @bobodtech.


Rate this post
Publicité
Article précédentWarzone Season 5 pour obtenir une collaboration de skins Umbrella Academy de type Fortnite
Article suivantHIFIMAN HE1000se Planar Magnetic Headphone + Examen du câble pleine taille Hapa Audio KnØt – Luminosité Premium
Avatar De Violette Laurent
Violette Laurent est une blogueuse tech nantaise diplômée en communication de masse et douée pour l'écriture. Elle est la rédactrice en chef de fr.techtribune.net. Les sujets de prédilection de Violette sont la technologie et la cryptographie. Elle est également une grande fan d'Anime et de Manga.

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici