データリネージがビジネスに与えるインパクトと次世代データリネージの必要性
データリネージとは、データの作成から現在に至るまでの全履歴を追跡可能にすることです。これはビジネスの効率化に貢献するばかりか、企業活動に関するさまざまな規制に対応するうえで欠かせないプロセスといえます。
この記事ではデータリネージの役割についてわかりやすく説明するとともに、今日のビジネスにおいて重要性が増している次世代データリネージついて紹介します。
データの系統を可視化するデータリネージ
データリネージの「リネージ(lineage)」とは「系統」とか「血統」といった意味です。つまりデータリネージとは、直訳すればデータの系統や血統のことを指しています。歴史学者や民俗学者が人類の系統(リネージ)をたどるように、データリネージはデータの系統をたどり、データのライフサイクルを可視化することができます。
データリネージによって明らかになるのは、主に以下のような情報です。
・データの作成に関する情報
・データの変換履歴と変換方法
・データの保管場所
・組織内でのデータの移動経路
・データの利用者、アクセス者
これらは食品などのトレーサビリティとよく似ています。トレーサビリティとは食品の生産段階から最終消費(あるいは廃棄)までのあらゆる情報を追跡可能にするものです。トレーサビリティが食品業界で重視され、注目されているのと同様、データリネージはデータ主導のビジネスを行うすべての企業にとって注目すべきツールといえます。
ビジネスにおけるデータリネージの役割
日々のビジネス活動で生み出されるデータは、オンプレミスやクラウド上のサーバに蓄積されるだけでなく必要に応じてサーバ間を移動していきます。その際「どのデータをどこに格納するか」を判断したり、「データを誰が、どのように移動したか」を把握するための手がかりになるのがデータリネージです。
データに基づいて意思決定を行う経営者は、出所や流通経路が不確かなデータや、加工・変更の有無が不明なデータを意思決定の根拠とすることはできません。「どのデータを使うべきか(もしくは使うべきでないか)」を判断する基準となるのもデータリネージです。
加えて、データリネージは「業界の規制にデータを準拠させる」際の判断材料にもなります。ここでいう「業界の規制」には、たとえば以下のようなものが挙げられます。
・EU一般データ保護規則(GDPR)
・カリフォルニア州消費者プライバシー法(CCPA)
・エビデンスに基づく政策立案法の基礎(U.S. Foundations for Federal Evidence-Based Policymaking Act)
・バーゼル銀行監督委員会規制239(BCBS239)
・第2次金融商品市場指令(MiFID II)
・包括的資本分析およびレビュー(CCAR)
規制への対応はビジネスの行方を大きく左右しかねないだけに、データリネージの重要性も非常に大きいといえるでしょう。
データリネージは企業のデータサイエンティストにとっても重要なツールです。彼らにはデータ品質の確保と向上や、データに関するトラブルシューティングを行うという責任が与えられています。膨大なデータの中から「複雑なフローを経て変質したデータや冗長化したデータを発見」し、それを修正するにはデータリネージが欠かせません。
ニーズが高まる「次世代データリネージ」
ところでデータリネージは決して目新しいものではありません。企業によってデータ活用が始まった当初から、データリネージという概念は存在しています。しかし旧式のデータリネージはサイロ化されたデータしか扱えず、多数のデータソースに膨大なデータが分散する今日のビジネスシーンに対応するのは困難です。
そこで必要とされるのが「次世代データリネージ」と呼ばれる多機能なデータリネージです。次世代データリネージはオンプレミス、ハイブリッド、マルチクラウドなどデータの格納場所に関係なく、エンドツーエンドでデータの系統をたどることができます。
またシンプルな機能しか備えていない、あるいはデータサイエンティストが手動で行う旧式のデータリネージと異なり、AIと機械学習(ML)を活用した次世代データリネージでは、数百・数千のデータソースや数千万のデータオブジェクトを迅速に、自動で処理することが可能です。
とはいえ、現在提供されているデータリネージツールがすべて同じように作成されているわけではありません。ツールの提供者、あるいは使用されているテクノロジーによってデータリネージツールの性能は異なります。つまり「すべてのデータリネージが同等の機能を備えているわけでなはい」ということです。
これから新たなデータリネージツールを選ぶ際は、より高度な機能を持った次世代データリネージを見極めることが求められるでしょう。
データリネージの活用事例
データリネージの活用によって成功を収めている企業はさまざまです。
たとえばオランダを本拠とする金融機関、ラボバンク(Rabobank)は、デジタル変革戦略の一環として旧来の手動によるデータリネージからAIを活用した次世代データリネージへと移行しました。その結果「規制コンプライアンス」「データ品質管理」「データ変更管理」「データ統合」の4つの分野で大きな改善が見られ、ビジネスの質が一層向上しました。
生命保険大手のAIAシンガポール(AIA Singapore)では、データリネージを「顧客情報をはじめとするビジネスデータを統一的に把握する」ために活用しています。膨大なコンテキストに埋もれたデータを発見し理解することで、その後のデータ品質の向上や販売活動の最適化、意思決定の促進、コスト管理などが容易になりました。