Data sharing

Databricks dévoile un protocole ouvert pour le partage sécurisé de données entre organisations

Databricks lance un protocole open source permettant aux organisations d’un écosystème de partager des données de manière sûre quels que soient les technologies, outils et formats qu’elles emploient.

(Source: juniart / Fotolia.com)
(Source: juniart / Fotolia.com)

A l’occasion de son événement annuel, Databricks a dévoilé Delta Sharing un projet open source permettant aux organisations de partager des données de manière standardisée et sécurisée. La solution répond au besoin grandissant des entreprises de tirer parti des données d’autres entreprises de leur écosystème. A titre d’exemple, Databricks mentionne un hôpital partageant des données avec une université pour la recherche de vaccins, ou un fabricant de moteur d’avions désireux d’analyser la les données de performance de ses produits collectées par less compagnies aériennes. «Pour les fournisseurs de données, le principal défi est aujourd'hui de faciliter la consommation à large échelle de leurs données, commente Matei Zaharia, Chief technologist et co-fondateur de Databricks. Une norme ouverte et interopérable pour le partage des données en temps réel améliorera considérablement l'expérience des fournisseurs et des utilisateurs de données».

> Lire aussi: Avec qui les entreprises sont-elles disposées à partager des données?

Delta Sharing a pour principal atout d’offrir un standard pour le partage de tout type de données et de s’affranchir des technologies, outils et formats employés par les organisations. Le protocole peut notamment être utilisé dans SQL , dans des outils d’analytics et les langages de programmation Python et R. Les organisations peuvent également utiliser le protocole pour partager des ensembles de données à grande échelle sans les copier dans les formats Apache Parquet et Delta Lake.

Côté sécurité, la solution dispose de contrôles intégrés et d’autorisations pour un partage des données répondant aux contraintes de conformité. Les équipes des différentes organisations peuvent ainsi faire des requêtes, visualiser et enrichir les données partagées avec leurs outils de choix, dont Azure Purview, GCP Big Query, AtScale, Collibra, Dremio, Immuta, Looker, Privacera, Qlik, Power BI, et Tableau.

Tags
Webcode
DPF8_218357