c01-informatica-platform-v2

メタデータ管理:インフォマティカのアプローチ

アクティブメタデータの共通基盤を構築して、業務部門とIT部門の連携を強化

自社のデータをどれだけ把握していますか?データのソースや参照先、アナリティクス/レポート作成との関連性を把握していますか?

企業が保有するすべての情報を十分に理解して価値を最大限に引き出すためには、それらの情報を取り巻く状況、コンテキストを把握しなければなりません。このようなコンテキストを提供するのがメタデータです。メタデータにより、データの品質、関連性、価値に対する理解を深めることができます。

また、メタデータは、データの探索や関係の把握、利用状況の追跡に加え、データ利用に関連する価値とリスクの評価などにも役立ちます。データの急増と分散化に伴い、データ管理はミッションクリティカルなプロセスとなっています。そしてメタデータ管理は今や、デジタルトランスフォーメーションを推進するうえで中心的かつ戦略的な役割を果たしています。

データ3.0時代で成功を収めるにはメタデータの管理が不可欠 - インフォマティカの製品およびマーケティング担当プレジデント、アミット・ワリアの解説をご覧ください(1分46秒)

メタデータの中でもとりわけ価値が高いのがアクティブメタデータ(機械学習を活用しながら人間の知識で補強した統合メタデータ)です。アクティブメタデータにより、データ管理プロセス全体がインテリジェントかつ動的なものになります。アクティブメタデータは、入念に構築されたデータ管理システムの重要な基盤となり、データプロジェクトのライフサイクル全体にわたってメリットをもたらします。例えば、不足しているデータや不正確なデータ、異常なデータなどもメタデータによって特定できます。メタデータを活用することで、レポートに使用するデータを自動的に修正およびエンリッチ化して、高いコストにつながるエラーをなくし、アナリティクスの質を強化して意思決定の質を高めることが可能になります。

インフォマティカのメタデータ管理

メタデータ管理に対するインフォマティカのアプローチにより、企業はアクティブメタデータを通じて、自社が保有するすべてのデータから最大限の価値を引き出すことができます。Informatica Metadata Managementにより、以下の主要4種類のメタデータを活用できます。

  • 技術:データベーススキーマ、マッピングとコード、トランスフォーメーション、品質チェック
  • 業務:グロッサリ用語、ガバナンスプロセス、アプリケーションとビジネスのコンテキスト
  • 運用とインフラストラクチャ:ランタイム統計、タイムスタンプ、ボリューム指標、ログ情報、システムおよびロケーション情報
  • 使用状況:ユーザー評価、コメント、アクセスパターン

これらの4種類のメタデータが、共通のメタデータ基盤のための土台となります。Informatica Metadata Managementでは、次のような豊富な機能を使用して、共通の基盤を構築できます。

  • 収集:クラウドとオンプレミスにあるすべてのデータシステム(データベース、ファイルシステム、統合ツールおよびプロセス、アナリティクスツール、データサイエンスツールなど)からメタデータを忠実に取り込み
  • キュレーション:グロッサリの用語やコンセプト、関係性、プロセスなどにより業務の観点からデータをドキュメント化して、収集したメタデータにこのビジネスコンテキストを付加。また、評価やレビュー、認定などの形式でユーザー入力を収集して、データ資産の有用性を他のユーザーに提示
  • 推論:インテリジェンスを活用することで、通常では特定しにくいメタデータ関係(データリネージやデータ類似など)を特定し、データセットの有用性ランキングをさまざまなタイプのユーザー向けに作成
 

統合メタデータプラットフォームがもたらす価値

インフォマティカは、技術、業務、運用、使用状況の各メタデータを収集して、企業が保有するデータ資産とその関係に関するナレッジグラフを作成します。そこにAIと機械学習を適用して、インフォマティカのすべてのデータ管理ソリューションと統合することで、アクティブなメタデータグラフを作成します。

このアクティブメタデータが、インフォマティカのIntelligent Data Platformの基盤となります。Intelligent Data Platformは、あらゆるデータ管理要件に対応しながら企業がそれぞれのペースで成長・進化させていくことが可能なモジュール式の統合プラットフォームです。このプラットフォームで獲得したインテリジェンスに基づき、業界初のメタデータ主導の人工知能であるCLAIRE™エンジンが、中核のデータ管理/ガバナンスプロセスを高速化および自動化します。CLAIREはメタデータを活用して、データドメインの探索、データの分類、類似データやその他のデータ関係の特定、次のベストアクションの提案、ビジネス用語と物理データセットの関連付けなどを自動的に実行します。

データインフラストラクチャにインテリジェントデータカタログを取り入れることで、すべてのデータ管理プロセスにアクティブメタデータを統合できます。Informatica Enterprise Data Catalogでは、CLAIREのインテリジェンスを活用しながら、全社のメタデータを収集し、メタデータをスキャンおよびインデックス化するための各種コネクタを使用してアクティブメタデータに変換できます。アクティブメタデータにより、自動化を推進できるだけでなく、アナリティクス、データサイエンス、ガバナンスなど、データに関連するビジネス上の優先課題に対応するためのデータ管理アプリケーションを、より簡単かつ効率的に構築、実装、運用できます。

 

アクティブメタデータ管理の利点

インフォマティカのアクティブメタデータ管理によるアプローチは、データ管理のライフサイクル全体に価値をもたらします。

  • 次世代アナリティクス
    • 関連データのシンプルな検索、探索、提案を通じて、セルフサービスによる分析を実現
    • リネージ、関係、品質など、データの完全なビューが表示されるため、信頼できるデータに基づいてアナリティクスを実行可能
    • データの可視性を高めて、データの準備や分析、AIアプリケーションのためのML(機械学習)モデル開発を迅速化することで、AI/MLプロジェクトを促進
  • データ品質とデータガバナンス
    • 重要なデータ要素を探索、分類、ドキュメント化して、優先的に取り組むべきデータガバナンスアクティビティを特定
    • 詳細なメタデータとリネージにより、技術コンテキストとビジネスコンテキストの連携を強化してデータガバナンスを推進
    • ビジネスシステムやビジネスプロセスの処理内容に応じてデータ品質をドキュメント化することで、データ品質問題の原因を可視化
  • Data Privacy
    • 構造化/非構造化データソースの両方を通じて、データ主体と個人データの関係を相互に関連付けることで、データ主体のアクセスリクエストを自動化
    • 機密データの保護ステータス、アクセス、蔓延、リスクエクスポージャを追跡することで、コンプライアンスの透明性を強化
  • Master Data Management
    • マスターデータに加える新しいデータソースのオンボーディングを検出して高速化
    • 追加の属性や階層構造を推定および提案することで、マスターデータモデルのエンリッチ化を簡素化
  • クラウドによる最新化
    • データ環境を総体的に把握して、優先的にクラウドに移行すべきデータセットとワークロードを特定
    • 詳細なリネージと影響分析により、中断を最小限に抑えながら、クラウド移行を実行
  • データ統合
    • データを抽出、変換、提供するためのマッピング提案により、データ統合パイプラインの構築をスピードアップ
    • 未整理のデバイスファイルやログファイルの構造を自動的に検出することで、ファイルの理解や作業を支援
  • データ管理用DevOps
    • 将来のキャパシティプランニング(能力計画)のための予測アナリティクスと提案を提供
    • What-if影響分析を実行するための詳細なリネージビューとビジネスロジックにより、効果的な変更管理を支援