通过将 Informatica Cloud Data Integration 与 Databricks Delta Lake 结合使用,数据摄取可以从多种混合源中智能摄取大量数据,并传入数据湖。Delta Lake 能够自动提供高可靠性和高性能。
使您可以更轻松地为大规模数据创建大容量数据管道。使用 Informatica Big Data Management 创建的拖放管道可以下推到 Databricks 中,以便在经优化的 Apache Spark 执行程序中进行处理。
借助正确的数据集,数据科学家可以构建更准确的模型,并验证用于创建人工智能模型和促进分析操作的数据沿袭。此外,端到端沿袭还满足 GDPR 及其他法规的要求。
“Databricks 与 Informatica 之间的无缝集成使数据工程师能够轻松发现正确的数据集,并将大量数据从多个源摄取到 Delta Lakes。这意味着,联合客户可以大规模使用 Databricks 提供的可靠性和性能为分析和机器学习准备好数据,并借助智能治理从端到端查找、跟踪和审计这些数据。”
— Ali Ghodsi,Databricks 公司创始人兼首席执行官