c07_databricks_v2
h01-databricks-1280x556

 

Dynamisez les pipelines de données pour les projets d'IA et d'analyses
avec Informatica et Databricks

Facilite l'acquisition et la préparation de données pour l'analyse et le Machine
Learning — pour que vous puissiez tirer le meilleur parti de sa valeur, plus rapidement.

 

c09-web-icon-clouddbase
 
Acquisition intelligente de données

L'acquisition de données à l'aide d'Informatica Cloud Data Integration dans un Delta Lake Databricks permet d'acquérir intelligemment dans un Data Lake des volumes importants de données provenant de plusieurs sources hybrides. Le Delta Lake offre automatiquement une fiabilité et des performances élevées.

c09_big-data-icon
Intégration de données de nouvelle génération

Facilite la création de pipelines de données volumineuses pour des données à grande échelle. Il est possible de déplacer les pipelines créés avec Informatica Big Data Management vers Databricks pour les implémenter de manière optimisée dans Apache Spark.

c09-web-icon-catalog-v2
 
Découverte et traçabilité de données

Avec les ensembles de données appropriés, les spécialistes des données peuvent créer des modèles plus précis et vérifier la traçabilité des données utilisées pour créer des modèles d'IA et alimenter les analyses. La traçabilité de bout en bout est également conforme au RGPD et aux autres régulations.

« L'intégration transparente entre Databricks et Informatica permet aux ingénieurs de données de découvrir facilement les ensembles de données appropriés et d'acquérir de grands volumes de données provenant de sources multiples dans des Delta Lakes. Cela signifie que les clients communs peuvent utiliser la fiabilité et les performances à l'échelle de Databricks pour préparer les données à l'analyse et au Machine Learning – et bénéficier d'une gouvernance intelligente pour trouver, suivre et auditer ces données de bout en bout. »

— Ali Ghodsi, co-fondateur et PDG de Databricks 

Les initiatives d'analyse et de Machine Learning réussies reposent sur des pipelines de données fiables

Écoutez Anil Chakravarthy, PDG d'Informatica, et Ali Ghodsi, PDG de Databricks, partager la scène de l'événement Informatica World 2019 et discuter de la manière dont leur partenariat accélère la création de pipelines de données intelligents.

Recommended Resources