c01-informatica-platform-v2

Metadata Management: Informatica의 접근 방식

활성 메타데이터의 공통 기반을 구축하여 비즈니스 및 IT 사용자 통합

데이터를 얼마나 이해하고 계십니까? 데이터가 어디에서 생성되었는지, 어디에서 참조되고 있는지 아니면 귀하의 분석 또는 보고 이니셔티브와 관련이 있는지 설명할 수 있습니까?

엔터프라이즈에서 사용 가능한 모든 데이터를 더 잘 이해하고 모든 가치를 활용하려면 컨텍스트가 필요합니다. 메타데이터는 이와 같은 중요한 요소를 제공하므로 메타데이터를 통해 데이터 품질, 연관성 및 가치를 더 잘 이해할 수 있습니다.

메타데이터는 데이터를 검색하고 데이터 관계를 이해하며 데이터 사용 방식을 추적하고 데이터 사용과 연관된 가치와 위험을 평가할 수 있습니다. 데이터가 매우 빠른 속도로 증가하고 분산됨에 따라 미션 크리티컬 프로세스로 전환되어 메타데이터 관리가 디지털 혁신을 주도하는 중심적이고 전략적인 역할을 하고 있습니다.

이 동영상에서는 Informatica의 제품 및 마케팅 부문 사장인 Amit Walia가 Data 3.0 시대에 메타데이터 관리가 왜 성공의 기초가 되는지를 설명합니다.

메타데이터는 머신 러닝과 사람의 지식으로 보강하고 함께 통합되어 활용될 때 더욱 많은 가치를 전달합니다. 그리고 다양한 데이터 관리 프로세스에 지능형 기능과 역동성을 부과합니다. 활성 메타데이터는 잘 구축된 데이터 관리 시스템의 중요한 기반이 될 수 있으므로 데이터 프로젝트의 전체 수명 주기에서 많은 이점을 제공합니다. 예를 들어, 메타데이터는 누락된 데이터, 잘못된 데이터 또는 변칙 데이터를 강조할 수 있습니다. 메타데이터를 활용하면 시스템은 데이터를 자동으로 정정하고 보고서로 데이터 공급을 보강하여 비용이 많이 드는 오류를 방지하고 분석 품질을 높여 의사결정을 개선할 수 있습니다.

Informatica Metadata Management

Informatica의 메타데이터 관리 접근 방식은 엔터프라이즈가 활성 메타데이터로 모든 데이터의 가치를 최대한 활용할 수 있도록 설계되었습니다. Informatica Metadata Management를 통해 엔터프라이즈는 다음과 같은 주요 메타데이터 범주를 활용하여 이 여정을 시작할 수 있습니다.

  • 기술: 데이터베이스 스키마, 매핑 및 코드, 변환, 품질 확인
  • 비즈니스: 용어, 거버넌스 프로세스, 애플리케이션 및 비즈니스 컨텍스트
  • 운영 및 인프라: 런타임 통계, 타임스탬프, 볼륨 지표, 로그 정보, 시스템 및 위치 정보
  • 사용: 사용자 평가, 의견, 액세스 패턴

이러한 4개 범주의 메타데이터는 공통 메타데이터 기반의 기초가 됩니다. Informatica Metadata Management는 다양한 기능 세트를 사용하여 다음과 같은 공유 기반을 구축합니다.

  • 수집: 데이터베이스 및 파일 시스템, 통합 도구 및 프로세스, 분석 및 데이터 과학 도구를 포함하여 클라우드 및 온프레미스에서 모든 엔터프라이즈의 데이터 시스템으로부터 높은 정확도로 메타데이터를 스캔합니다.
  • 정리: 용어, 개념, 관계 및 프로세스로 데이터의 비즈니스 보기를 문서화합니다. 수집된 메타데이터로 이 비즈니스 컨텍스트를 보강하십시오. 평가, 검토 및 인증 양식으로 사용자 입력을 수집하여 다른 사용자에 대해 데이터 자산의 유용성을 평가할 수 있습니다.
  • 추론: 데이터 연계, 데이터 유사성, 다양한 유형의 사용자에게 가장 유용한 데이터 세트 순위 지정 등 수집된 메타데이터에서 명확하지 않은 관계를 도출하기 위해 인텔리전스를 적용합니다.
 

통합 메타데이터 플랫폼의 뛰어난 성능

Informatica는 기술, 비즈니스, 운영 및 사용 메타데이터를 수집하여 엔터프라이즈의 데이터 자산 및 관계에 대한 정보 그래프를 생성합니다. AI 및 머신 러닝을 적용하여 모든 데이터 관리 솔루션에 통합함으로써 이 메타데이터 그래프를 활성화할 수 있습니다.

활성 메타데이터는 Informatica의 Intelligent Data Platform에 대한 통합 기반 역할을 합니다. 이 솔루션은 모든 데이터 관리 요구 사항을 충족하면서 원하는 속도로 성장 및 진화시킬 수 있는 통합된 모듈식 플랫폼입니다. 그리고 핵심 데이터 관리 및 거버넌스 프로세스를 가속화 및 자동화하기 위한 업계 최초의 메타데이터 중심 인공 지능, CLAIRE™ 엔진에서 인텔리전스를 강화합니다. CLAIRE는 메타데이터를 활용하여 자동으로 데이터 도메인을 검색하고 데이터를 분류하며 유사한 데이터와 기타 데이터 관계를 식별하고 차선책을 권장하며 비즈니스 용어를 물리적 데이터 세트와 연관시킬 수 있습니다.

지능형 데이터 카탈로그를 데이터 인프라의 핵심 부분으로 만들어 활성 메타데이터가 모든 데이터 관리 프로세스에 통합되도록 할 수 있습니다. Informatica Enterprise Data Catalog는 엔터프라이즈 범위에서 메타데이터를 캡처하고 CLAIRE의 인텔리전스로 강화된 메타데이터를 스캔 및 색인화할 수 있는 광범위한 커넥터를 사용하여 활성 메타데이터로 전환시킵니다. 활성 메타데이터는 자동화 기능을 추가하고 사용자가 분석, 데이터 과학, 거버넌스 및 기타 데이터 중심 비즈니스 우선순위를 위한 데이터 관리 애플리케이션을 보다 쉽고 효율적으로 구축, 배포 및 운영 할 수 있도록 합니다.

 

활성 메타데이터 관리의 이점

다음은 데이터 관리 수명 주기 동안 Informatica의 활성 메타데이터 관리 접근 방식이 가치를 제공하는 몇 가지 방법입니다.

  • Next-Generation Analytics
    • 관련 데이터에 대한 간단한 검색 및 추천을 통해 셀프서비스 활성화
    • 계보, 관계 및 품질을 포함한 전체 데이터 보기를 제공하여 분석 데이터에 대한 신뢰 향상
    • AI 애플리케이션을 위한 ML 모델의 민첩한 데이터 준비, 분석 및 개발을 위한 향상된 데이터 가시성으로 AI/ML 프로젝트 가속화
  • Data Quality and Governance
    • 데이터 거버넌스 활동의 우선순위를 정하는 데 도움이 되는 주요 데이터 요소를 발견, 분류 및 문서화
    • 데이터 거버넌스에 대한 기술 및 비즈니스 컨텍스트를 연결하기 위한 자세한 메타데이터 및 계보 제공
    • 비즈니스 시스템 및 프로세스와 관련하여 데이터 품질을 문서화하여 데이터 품질 문제의 소스에 대한 가시성 향상
  • Data Privacy
    • 구조화된 소스와 구조화되지 않은 소스에서 개별 주체와 개인 데이터 간의 관계를 연관시켜 주체 액세스 요청 자동화
    • 민감한 데이터의 보호 상태, 액세스, 확산 및 위험 노출을 추적하여 규정 준수 투명성 향상
  • Master Data Management
    • 마스터 데이터에 포함되어야 하는 새로운 데이터 소스의 온보딩 발견 및 가속화
    • 마스터 데이터 모델의 보강을 단순화하기 위해 추가 속성 및 계층 구조를 추론 및 권장
  • Cloud Modernization
    • 데이터 환경에 대한 포괄적인 이해를 통해 클라우드 마이그레이션을 위한 데이터 세트 및 워크로드 우선순위 지정
    • 최소한의 중단으로 클라우드 마이그레이션을 지원하기 위한 세부 계보 및 영향 분석 제공
  • Data Integration
    • 데이터 추출, 변환 및 전달을 위한 매핑에 대한 권장 사항으로 데이터 통합 ​​파이프라인 개발 속도 가속화
    • 혼잡한 장치 및 로그 파일에서 구조를 자동으로 가져와서 보다 쉽게 이해 및 작업할 수 있도록 함
  • DevOps for Data Management
    • 향후 용량 계획에 대한 사전 분석 및 권장 사항 제공
    • 가상(what-if) 영향 분석을 가능하게 하는 세부 계보 보기 및 비즈니스 로직으로 변경 사항을 효과적으로 관리