Google a annoncé la disponibilité générale de Dataplex, une structure de données intelligente qui vous permet de gérer, de surveiller et de gouverner de manière centralisée les données sur les lacs de données, les entrepôts de données et les magasins de données, et de rendre ces données accessibles en toute sécurité à une variété d’analyses et de science des données. outils.
Dataplex permet aux entreprises de déléguer la propriété, l’utilisation et le partage des données et fournit un seul interface unifiée pour surveiller et gouverner de manière cohérente les données dans tous les domaines de données.
Dataplex vous permet d’unifier les données (distribuées sur des lacs de données, des entrepôts de données et des magasins de données) sans aucun déplacement de données, de les organiser en fonction des besoins de votre entreprise et de gérer, surveiller et gouverner ces données de manière centralisée. Dataplex permet la standardisation et l’unification des métadonnéesles politiques de sécurité, la gouvernance, la classification et la gestion du cycle de vie des données sur ces données distribuées.
Dataplex récolte les métadonnées des données structurées et non structurées, en utilisant des contrôles de qualité des données intégrés pour améliorer l’intégrité. Il enregistre automatiquement toutes les métadonnées dans un metastore unifié. Les données et les métadonnées sont également accessibles via une variété de services Google Cloud, tels que BigQuery, Dataproc Metastore, Data Catalog et des outils open source, tels qu’Apache Spark et Presto.