データの安全・適切な活用環境を整備するため、メタデータの分類・可視化に取り組むLINE

期待効果

  • ビジネスメタデータの可視化
  • 「データの民主化」を推進
  • データ系組織における生産性の向上

LINEは、社内のデータ活用者に対する「データの民主化」を目指しています。この目的のためにインフォマティカ製品を採用し、システムメタデータとビジネスメタデータを分類・可視化したデータカタログを構築。データにまつわる透明性を担保しながら、安全で適切なデータ活用環境を実現しています。

[課題背景]

データへの理解を深め、適切な活用を促すには、メタデータの 収集・可視化が不可欠だった

LINEは日本最大のコミュニケーションプラットフォームを運営する企業です。対話アプリをはじめ、音楽コンテンツやオンライン診療、電子決済など、幅広いサービスを展開しています。同社には、顧客のアクティビティなどに関する大量のデータが日々蓄積されています。そのデータ量は数百PB(ペタバイト)にもなり、個人情報などセンシティブなデータも含まれます。LINEの社員が安全な環境でデータにアクセスでき、各々の業務で適切に活用できる基盤を用意するミッションを担うのが、Data Management室です。

「我々が目指しているのは『データの民主化』です。そのための戦略として、社員のデータ活用リテラシー向上につながる教育プログラムを展開しています。2021年にはチーフデータオフィサー(CDO*1)の設置とともに、役員レベルと現場レベルの会議体を設け、データの民主化に向けて全社の協力を得られる仕掛けを用意しました。また、攻めの面からは、データを業務効率の向上やサービスの進化につなげるため、ビジネスコンサルタントら専門職の社員が現場をサポートしています。そして守りの面では、安全で適切なデータ活用環境を維持・強化するためのガイダンスを作成し、社員に守るべきルールなど周知してきました」。同社 Data EngineeringセンターData Management室 室長 勝山公雄氏はこのように説明します。

LINEの各事業・サービスから収集したデータに論理的なグルーピングを施し、データ活用のプラットフォームとして整備したものが、同社が「Information Universe(IU)」と名付けているデータレイクです。「2021年当時のIUは、各々のデータを利用しているメンバー・所属部門の情報、契約に関する情報など、ビジネスメタデータ*2が収集できていない状況にありました。この点をクリアにし、マネジメントを担う我々の側も、データへの理解を深めていく必要性を強く感じていたのです」(勝山氏)。

同社はこの課題を踏まえ、LINEグループ内のビジネスメタデータとシステムメタデータ*3を収集してデータカタログを構築し、2種類のメタデータを相互に紐づけることで、データ活用時の透明性を高めることを目指しました。

 

*1 データの安全な管理と利活用を推進する責任者。

*2 ITから独立した、業務に関するメタデータ。データを利用しているメンバーやプロジェクトの情報、データを扱うための利用規約などを指す。

*3 データの技術的な詳細やカラムのプロパティといった「テクニカルメタデータ」と、バッチの実行ログやデータ抽出の履歴などシステム運用の過程で生成される「オペレーショナルメタデータ」の総称。

「データの民主化」を支えるデータマネジメントソリューションを提供するという、インフォマティカ社の明確な企業姿勢も、製品を選定するうえで大切なポイントになりました

勝山 公雄氏

LINE株式会社 Data Engineeringセンター Data Management室 室長

[戦略・施策]

CDOの観点を重視しながら、ビジネスメタデータの収集を計画

データカタログの構築にあたって、勝山氏が重視したのは、「データを安全・適切に活用するために、CDOはどのような点を確認しようとし、我々の部門に質問を投げかけてくるのか」ということでした。「たとえば、“LINEグループのA社はどんなデータを保有しているのか”“そのデータはB社も利用できるものなのか”といった、データ利用に関する契約状況をはじめとする想定質問を、いくつかリストアップしました。こうした質問に対して明確な回答ができるデータカタログを整備するために、まずグループ内に分散していたビジネスメタデータ の収集を計画しました」(勝山氏)。

LINE integrated Data Catalog

LINEユーザーのサービス利用履歴(ログデータ)をはじめとするトランザクションデータとシステムメタデータを、HadoopによってInformation Universe(IU)に蓄積している。

AxonとEDCを組み合わせることで、「LINE Integrated Data Catalog」と名付けたデータカタログを構築。IUや個別システムが保有していたシステムメタデータと、ビジネスメタデータの統合的・横断的な管理を実現している。

[製品選定のポイント]

データ管理上の重要な観点など、新たな「気づきを与えてくれる」点を評価

続いてData Management室では、CDOからの質問に対応しながら、メタデータを用いてデータ理解を深めるしくみを構築するために、データマネジメント製品の調査を行いました。

検討の結果、インフォマティカの「Axon DataGovernance(Axon)」と「Enterprise Data Catalog(EDC)」を選定しています。「Axonは、ビジネスメタデータを格納するしくみがとても良く考えられており、優れた機能を備えています。たとえばCDOから、あるグループ会社に関する質問があれば、【Company】というタグを使ってリサーチできます。このほか【プロジェクト】【サービス】など、多面的な観点からタグ付けができます。さらには、“こんな観点からもメタデータを管理すると良いですよ”と、我々に気づきを与えてくれる製品だと評価しました」(勝山氏)。

一方、EDCについては「Axonとセットで導入することで、システムメタデータとビジネスメタデータを分類・可視化したデータカタログが構築できることを評価し、選定しました」と、勝山氏は話します。

[導入効果]

法改正への対応、データ戦略の立案などに寄与。「データの民主化」が着実に進展

インフォマティカ製品を活用した最初の取り組みは、2022年4月に改正された個人情報保護法への対応でした。「分散していた個人情報をEDCとAxonによって収集し、その所在を明確にしました。機微度に応じて4段階の個人情報を設定しており、Axonで適正な管理が可能になりました」と、勝山氏は述べます。

同社では現在、メタデータの紐付けと可視化によって、“このデータはどのような契約の下で利用されているのか”“どのプロジェクトが使っているのか”“何のサービスに寄与しているのか”など、データにまつわる透明性を担保しながら、データの適切な活用環境が実現しています。

「データカタログを設けたことで、データの民主化は着実に進展しました。CDOが取り組みたいことを基に、データの理解に必要な要件を定義するなど、戦略の立案と攻め・守りの手段を考える上で、助けになるツールになると確信しています。そしてユーザーには、データビジネスコンサルタントらのサポートを得ながら、これまで気づかなかったデータ群が社内に存在することを認識してもらい、それらの活用が新事業の立ち上げなどに繋がれば良いと考えています」(勝山氏)。

一方、定量的な効果については、「グループ内の法人間で交わす、機微情報の利用に関する契約状況などをAxonで収集・管理することで、ユーザーからの問い合わせ件数が減り、結果として我々の業務効率は30~40%ほど向上するのではないか」と、勝山氏は想定します。今後はデータ分析のアジリティを高めることで、さらなるデータ活用の促進を計画しています。

「そのためには、データレイクとして運用するIUのフロント部分に新たな階層を設け、クラウド化したDWHとデータマートの構築を構想しています」と、勝山氏は話します。同社は「Life on LINE」というビジョンを掲げ、LINEが常に人々の傍に寄り添い、生活のすべてを支えるライフインフラになることを目指しています。「我々が推進している『データの民主化』は、このビジョンにマッチする部分が多いと思っています。まずはLINEの社員が、お客様からお預かりしているデータを適切に活用することで、『Life on LINE』をより良い状態にしていけると考えています」(勝山氏)。