Informatica Cloud Data Integration을 사용하여 Databricks Delta Lake로 데이터를 수집하면 여러 하이브리드 소스에서 단일 데이터 레이크로 대용량 데이터를 지능적으로 수집할 수 있습니다. Delta Lake는 자동으로 높은 안정성과 성능을 제공합니다.
데이터를 위한 대용량 데이터 파이프라인을 규모에 맞게 보다 쉽게 구축할 수 있습니다. Informatica Big Data Management로 구축된 파이프라인을 Databricks로 드래그 앤 드롭하여 최적화된 Apache Spark 구현에서 처리할 수 있습니다.
올바른 데이터 세트를 통해 데이터 과학자는 보다 정확한 모델을 구축하고, AI 모델을 생성하고 분석을 가속하는 데 사용되는 데이터 연계를 검증할 수 있습니다. 포괄적인 연계는 GDPR 및 기타 규정 준수를 해결합니다.
“Databricks와 Informatica 간의 원활한 통합을 통해 데이터 엔지니어는 올바른 데이터 세트를 쉽게 검색하고 여러 소스에서 Delta Lakes로 대용량 데이터를 수집할 수 있습니다. 이는 공동 고객이 Databricks의 안정성과 성능으로 분석 및 머신 러닝을 위한 데이터를 규모에 맞게 준비할 수 있으며, 인텔리전트 거버넌스를 통해 해당 데이터를 포괄적으로 찾고 추적하고 감사할 수 있다는 의미입니다.”
— Ali Ghodsi, Databricks 공동 창립자 겸 CEO
AI 및 분석 이니셔티브를 가속화할 수 있는 방법을 알아보십시오.