L'acquisition de données à l'aide d'Informatica Cloud Data Integration dans un Delta Lake Databricks permet d'acquérir intelligemment dans un Data Lake des volumes importants de données provenant de plusieurs sources hybrides. Le Delta Lake offre automatiquement une fiabilité et des performances élevées.
Facilite la création de pipelines de données volumineuses pour des données à grande échelle. Il est possible de déplacer les pipelines créés avec Informatica Big Data Management vers Databricks pour les implémenter de manière optimisée dans Apache Spark.
Avec les ensembles de données appropriés, les spécialistes des données peuvent créer des modèles plus précis et vérifier la traçabilité des données utilisées pour créer des modèles d'IA et alimenter les analyses. La traçabilité de bout en bout est également conforme au RGPD et aux autres régulations.
« L'intégration transparente entre Databricks et Informatica permet aux ingénieurs de données de découvrir facilement les ensembles de données appropriés et d'acquérir de grands volumes de données provenant de sources multiples dans des Delta Lakes. Cela signifie que les clients communs peuvent utiliser la fiabilité et les performances à l'échelle de Databricks pour préparer les données à l'analyse et au Machine Learning – et bénéficier d'une gouvernance intelligente pour trouver, suivre et auditer ces données de bout en bout. »
— Ali Ghodsi, co-fondateur et PDG de Databricks
Écoutez Anil Chakravarthy, PDG d'Informatica, et Ali Ghodsi, PDG de Databricks, partager la scène de l'événement Informatica World 2019 et discuter de la manière dont leur partenariat accélère la création de pipelines de données intelligents.
Découvrez comment accélérer vos initiatives d'analyse et d'IA.