企業に必要なデータマネージメントとは?
データマネージメントとは?
「データマネージメント」と聞くと難しいトピックだと感じる方もいらっしゃるのではないでしょうか。例えばDAMA-DMBOK 第2版ではデータマネージメントとは「データとインフォメーションという資産の価値を提供し、管理し、守り、高めるために、それらのライフサイクルを通して計画、方針、スケジュール、手順などを開発、実施、監督することである。」と記述されています。
今回はデータマネジメントを「信頼できるデータを、企業内の誰もが適切な用途において利活用できるよう、データを定義し、見つけられるようにし、コラボレーションできるようにすること」と解釈して考えてみたいと思います。
データマネージメントが必要な背景
企業には業務プロセスが存在し、そのプロセスを支える仕組みとして様々なシステムやクラウドサービスが存在し、そのシステムには顧客から入手・収集したり、第三者から入手した情報やデータが格納されています。また、業務プロセスを支える仕組みの他に分析業務を支援するようなシステムも存在します。
あらゆる業務を支える唯一無二のシステムが1つだけ存在し、そのシステムにあらゆるデータが存在していれば管理の観点では楽ですが、実体はその真逆で、企業の成長や歴史にあわせて新たなプロセスが生まれ、それを支えるシステムが増え続けているのが現実に起きていることだと思います。
このような複雑なシステム環境とデータをどう適切に管理していけばよいのか?ということがそもそもデータマネージメントが求められる背景・必要性と言えるでしょう。
データマネージメントに必要な要素
データマネージメントの実現に向けてはテクノロジーのみならずヒトや組織、データマネージメントそのもののプロセス整備も必要ですが、ここではデータマネージメントを実現するにあたって必要なテクノロジー要素にフォーカスして、必要となる要素を整理してみます。
1.ビジネスメタデータを管理・可視化する仕組み (Axon Data Governance)
データマネージメントと聞くとシステムを中心とした取り組みと思われがちですが、そもそも
・企業内にどういう人がいて、どんなロールを担っているのか?
・データの取り扱いについて守るべき規則や対応しないといけない規制などにどんなものがあるのか (ポリシーやルール)?
・守るべき規則に則っているかを把握するための指標は何か(メトリック)?
などが定まっていないと、何をどう管理すればよいのかすら決めることができません。これらの情報は様々な部門が各々管理していたり、もしくは誰かの頭の中に入っていたりするかもしれませんが、それらの情報を企業全体で共有し、可視化することで、必要な統制をかけつつ、データの利活用を促進することが可能になるのです。
2.システムメタデータを管理・可視化する仕組み (Enterprise Data Catalog)
様々なシステムに格納されているデータのシステム定義を中心として、物理的なデータを可視化するのがデータカタログです。データカタログを活用することによって、下記のような内容を網羅的に管理・可視化することができるようになり、企業内のあらゆるシステム横断でデータを検索し、所在をつきとめ、信頼性を見極め、利活用につなげることが容易になります。
・どんなデータが、どんな仕組みに存在しているか?
・データがどのような経路で仕組み間を流通しているのか(データリネージ)?
・意味合いが同じ、もしくは似ているデータがどこに、どれくらいあるのか(データドメイン)?
3.データ品質を担保する仕組み (Data Quality)
データカタログを活用することによってデータの所在を可視化することはできますが、所在がわかったところでデータが利活用にこと足りる品質を保っていなければ意味がありません。
データ品質管理の仕組みを利用することによって下記のような内容を網羅的に把握・可視化でき、データ品質を向上させ、担保することが可能になります。
・現状の棚卸し (データのプロファイリング)
・データの標準化・クレンジング
・データ品質のスコアリング
特にデータ品質のスコアリングは、データはあくまでも汚れていくものである、という前提で考えた際にはデータ品質を担保するためのキーとなる要素であり、データマネージメントにおいて重要な要素となります。
まとめ
上述の3つの要素以外にも、マスタデータの管理や、個人情報など機密情報の取り扱いなどといった要素も必要ではありますが、まずは下記の3つを企業全体で可視化し、共有することがデータマネージメントに向けての第1歩とインフォマティカでは考えています。
- 業務を遂行する上で、どういう人が、どういうロールで、どういうデータを扱っているのか・扱っていいのか?またデータを扱う上でどのような規則があるのか?
- データが格納されているシステムにはどういうものがあって、どういうデータが格納されているのか?
- 格納されているデータは、利活用できる品質を保っているのか?