Basé sur le cloud entrepôt de données compagnie Flocon de neige Lors de son sommet annuel Snowflake, mardi, il a présenté un nouvel ensemble d’outils et d’intégrations pour affronter des sociétés rivales d’analyse et de bases de données telles que Teradata, et des services tels que Google BigQuery et Amazon Redshift.
Les nouvelles fonctionnalités, qui incluent des outils d’accès aux données et la prise en charge de Python sur le système de développement d’applications Snowpark de l’entreprise, visent à scientifiques des données, ingénieurs de données, et les développeurs, dans le but d’accélérer le développement d’applications, en particulier pour apprentissage automatique Programmes.
Snowpark, lancé il y a un an, est un environnement de développement de type dataframe conçu pour permettre aux développeurs de déployer leurs outils préférés sans serveur sur le moteur de calcul d’entrepôt virtuel de Snowflake. La prise en charge de Python est en préversion publique.
« Python est probablement la fonctionnalité la plus demandée que nous entendons de la part de nos clients », a déclaré Christian Kleinerman, vice-président directeur des produits chez Snowflake.
La demande pour Python est logique, car c’est un langage de choix pour les scientifiques des données, disent les analystes.
« Snowflake est en train de rattraper son retard sur ce front, car des rivaux tels que Teradata, Google BigQuery et Vertica ont déjà un support Python », a déclaré Doug Henschen, analyste principal chez Constellation Research.
Snowflake a également déclaré qu’il ajoutait une intégration Streamlit pour le développement et l’itération d’applications. Streamlit, qui est un framework d’application open source en Python destiné aux équipes d’apprentissage automatique et d’ingénierie en science des données pour aider à visualiser, modifier et partager des données, a été acquis par Snowflake en mars.
L’intégration permettra aux utilisateurs de rester dans l’environnement Snowflake, non seulement pour accéder, sécuriser et gouverner les données, mais aussi pour développer des applications de science des données pour modéliser et analyser les données, a déclaré Tony Baer, analyste principal chez dbInsights.
Snowflake lance des intégrations liées à Python
Parmi les autres outils et intégrations liés à Python dévoilés lors du sommet, citons Snowflake Worksheets for Python, Large Memory Warehouses et SQL Machine Learning.
Snowflake Worksheets for Python, qui est en préversion privée, est conçu pour permettre aux entreprises de développer des pipelines, des modèles d’apprentissage automatique et des applications via l’interface Web de la société, baptisée Snowsight, a déclaré la société, ajoutant qu’elle avait des capacités telles que la saisie semi-automatique du code et la génération de logique personnalisée.
Afin d’aider les scientifiques des données et les équipes de développement à exécuter des opérations gourmandes en mémoire telles que l’ingénierie des fonctionnalités et la formation aux modèles sur de grands ensembles de données, la société a déclaré qu’elle travaillait sur une fonctionnalité appelée Grands entrepôts de mémoire.
Actuellement en phase de développement, Large Memory Warehouses fournira un support pour les bibliothèques Python grâce à l’intégration avec la plate-forme de science des données Anaconda, a déclaré Snowflake.
« Plusieurs rivaux sont configurables pour prendre en charge les entrepôts à grande mémoire ainsi que les fonctions Python et la prise en charge des langages, c’est donc Snowflake qui répond aux demandes du marché », a déclaré Henschen.
Snowflake propose également SQL Machine Learning, en commençant par les données de séries chronologiques, en préversion privée. Le service aidera les entreprises à intégrer des prédictions et des analyses basées sur l’apprentissage automatique dans les applications de business intelligence et les tableaux de bord, a déclaré la société.
De nombreux fournisseurs de bases de données analytiques, selon Henschen, ont construit des modèles d’apprentissage automatique pour l’exécution dans la base de données.
« La raison d’être de Snowflake en commençant par l’analyse des données de séries chronologiques est la suivante : [that it is] parmi les analyses d’apprentissage automatique les plus populaires, car il s’agit de prédire les valeurs futures en fonction des valeurs précédemment observées », a déclaré Henschen, ajoutant que l’analyse de séries chronologiques comportait de nombreux cas d’utilisation dans le secteur financier.
Les mises à jour snowflake permettent un meilleur accès aux données
Avec la logique selon laquelle un accès plus rapide aux données pourrait conduire à un développement plus rapide des applications, Snowflake a également introduit mardi de nouvelles fonctionnalités, notamment la prise en charge des données en streaming, les tables Apache Iceberg dans Snowflake et les tables externes pour le stockage sur site.
La prise en charge des données en streaming, qui est en préversion privée, aidera à éliminer les frontières entre les pipelines de streaming et de traitement par lots avec Snowpipe, le service d’ingestion continue de données de la société.
La raison d’être du lancement de la fonctionnalité, selon Henschen, est le grand intérêt pour la prise en charge des options à faible latence, y compris le streaming en temps quasi réel et réel, et la plupart des fournisseurs de ce marché ont coché la case streaming.
« Le feature offre aux équipes d’ingénierie un moyen intégré d’analyser le flux à côté des données historiques, afin que les ingénieurs de données n’aient pas à bricoler quelque chose eux-mêmes. C’est un gain de temps », a déclaré Henschen.
Afin de répondre à la demande pour plus de formats de table open source, la société a déclaré qu’elle développait Apache Iceberg Tables pour fonctionner dans son environnement.
« Apache Iceberg est un format de table open source très populaire et il gagne rapidement du terrain pour les plates-formes de données analytiques. Les formats de tableau tels que Iceberg fournissent des métadonnées qui contribuent à la cohérence et aux performances évolutives. Iceberg a également été récemment adopté par Google pour son offre Big Lake », a déclaré Henschen.
Pendant ce temps, dans le but de maintenir l’engagement de ses clients sur site tout en essayant de les amener à adopter sa plate-forme de données cloud, Snowflake introduit le stockage sur site de tables externes. Actuellement en préversion privée, l’outil permet aux utilisateurs d’accéder à leurs données dans des systèmes de stockage sur site de sociétés telles que Dell Technologies et Pure Storage, a déclaré la société.
« Snowflake avait une politique de ‘cloud uniquement’ depuis un certain temps, de sorte qu’ils avaient clairement de gros clients importants qui voulaient un moyen d’intégrer des données sur site dans l’analyse sans tout déplacer dans Snowflake », a déclaré Henschen.
En outre, Henschen a déclaré que ses rivaux, notamment Teradata, Vertica et Yellowbrick, proposent un déploiement sur site ainsi qu’un déploiement hybride et multicloud.
Droits d’auteur © 2022 IDG Communications, Inc.