01 02 次のページへ →
 
  • 多くの企業では、さまざまなデータが分散して存在します。営業部が管理する顧客や販売のデータ、経理部門が管理する売上げや経費のデータ、出荷部門が管理する在庫と流通データ、製造部門が管理する仕入れや製品のデータなどです。

  • しかし企業が精度の高い効果的な経営を行っていくためには、これらの経営に直結するデータを、総合的に確認、分析し、次の戦略を確定していかなければなりません。
  • もしも社内のすべてのシステムが、巨大な1つのマスターデータベースからなる万能の情報システムで運営されているのなら、これを実現するのはたやすく、すべての部署や経営陣はそこから高い精度で各部門の状況、そして会社全体の経営状態を把握することができるでしょう。
  • しかし実際はどうでしょうか?

システムインテグレーションにはデータ統合の課題が存在する

  • 現実には、企業活動のすべてを1つのシステムで実現できるような万能の情報システムなど存在しません。企業のシステムとは常に、ERPシステムやSFAシステム、CRMシステム、SCMシステムのような個別のシステムと、それらのシステムを連携し、全データを統合するシステムによってできているものです。
  • しかも今やシステム連携やデータ統合の範囲は、関係取引先や顧客など、社外にまで広がってきています。
  • このシステム連携やデータ統合には、重要な課題があります。それは、別のシステムとして構築され、蓄積されたデータを迅速かつ正確に、そして確実に統合するという課題です。そのためには、フィールドの統一、データベース間における文字コードなどのデータ変換、データ統合時に発生する重複や矛盾、エラーやあいまいさの排除と修正といったことを高速かつ効率的に行うプラットフォームが必要です。
  • インフォマティカは、こうしたデータ統合の課題を解決する理想的な製品群を提供しています。

INFORMATICA製品概要


  • INFORMATICA の製品群は、次の3つの製品から構成されています。

  • ■INFORMATICA PowerCenter
    PowerExchangeによるデータコネクションを管理し、データのアクセス、プロファイリング、変換、統合、配布を実装し、差分抽出やリアルタイム処理、バッチ処理、可用性の高いデータ統合に必要なすべての操作を行うデータ統合マネジメントソフトウェア
  • ■INFORMATICA PowerExchange
    メインフレームからパッケージソフト、RDB、XML、CSVなど、あらゆるデータ形式の入出力に対応した総合データコネクションソフトウェア
  • ■INFORMATICA Data Quality
    データ欠損の有無、 フォーマットの整合性、 重複データの確認、データのゆらぎ等、データ品質をさまざまなロジックで自動的にチェックし、高品質なデータのアウトプットを実現するデータクレンジングソフトウェア
  • 基本的にINFORMATICA PowerExchangeとINFORMATICA PowerCenterはセットで利用し、データ統合の要求に応じてINFORMATICA Data Qualityを追加として用います。

 

図:INFORMATICAが構成する3つの製品の全体像

Informaticaが構成する3つの製品の全体像

 

  • 個々の製品について詳しく紹介しましょう。

INFORMATICA PowerCenter

  • PowerCenterは、データ統合に必要なすべてのロジックの設計を行うことができます。具体的には、PowerExchangeによるデータソースへの接続を管理し、受け取ったデータの変換、統合、差分抽出などのデータ操作、およびそれらのリアルタイム処理、バッチ処理などの実行処理、そして高可用性の提供などを実現します。

 

図:PowerCenter Designerで、データソースを並べ、処理を設定
  >>クリックして拡大

PowerCenter Designerでデータソースを並べ、処理を設定

 

INFORMATICA PowerExchange

  • PowerExchangeはメインフレームやパッケージソフト、データベース、フラットファイルなど、企業内で利用されているあらゆるデータソースへ接続できる機能を備えています。

     

  • 多くのシステム統合プロジェクトではデータソースへの接続や変換のために個別のソフトウェアが開発される傾向にありますが、PowerExchangeを用いることでそうした手間と時間、そして継続的なコストのかかるメンテナンス要員の確保などが不要になります。インフォマティカがこれまで蓄積してきたさまざまなデータソースへの接続技術が集約されたソフトウェアは、何よりも信頼性が高く高速な接続を実現します。

 

図:PowerExchangeでサポートする主なデータソース

PowerExchangeでサポートする主なデータソース

 

  • PowerExchangeがサポートしているのは、いわゆるデータベースに格納されている構造化されたデータだけではなく、XML文書などの半構造化データや文書など非構造化データ、メッセージングデータなども含まれます。企業で扱うあらゆるデータタイプのデータソースをカバーしています。

  • ■グラフィカルな開発環境とデバッグ
    PowerCenterは、PowerExchangeで接続したデータソースの中から、どのようなデータを抽出するのかを選択、それらをどう組み合わせ、どのような処理をするのか、例えば結合するのか、差分を抜き出すのか、集計するのか、といった内容を定義し、最終的にどのようなデータ形式でどこへ出力するのか、といったロジックを設定できます。
  • この設定はグラフィカルな操作によって簡単に行うことが可能です。

  • また、実際にデータ操作のロジックを確認するため、各段階でどのようにデータが加工されているかを確認でき、また実行ログも取得できるため、効率よくロジックの設計、デバッグが行えます。もちろん、ロジックはすべてバージョン管理の対象であり、データソースやロジックの部品化もでき、大規模な開発にも対応することが可能です。

  • ■メタデータマネジメント
    PowerCenterはデータソースをあらかじめカタログ化することによって、社内にどのようなデータが存在するのか、それぞれの依存関係などを一元的かつビジュアルに把握する「Metadata Manger」を備えています。PowerCenterは単なるデータ加工ツールではなく、システム全体を見渡すメタレベルでのデータマネジメントツールとしても使うことが可能です。
  • ■リアルタイム処理、バッチ処理、高可用性
    PowerCenterは、設定されたロジックの実行をリアルタイムに、あるいは定期的なバッチ処理のいずれでも行うことが可能です。すべてのロジックは強力なパラレル処理機能により高速に実行されます。
  • また処理中にエラーが発生しても、データの整合性や一貫性を確実に担保しつつ処理を継続するトランザクション機能、フェイルオーバーによって別のサーバが処理を引き継ぐ高可用機能などを備えています。

INFORMATICA Data Quality

  • Data Qualityは、データの欠損、揺らぎ、矛盾や重複といったデータの品質を下げる要素を取り除き、高いデータ品質のアウトプットを実現します。

  • ■データ品質は業務の品質に影響する

    企業が扱うデータには、ときに間違いや揺らぎや欠損があります。例えば同じ企業なのに前株や後株の表記を間違って二重に入力されていたり、英語のスペルが微妙に間違っていたり、小さな「ヵ」と大きな「カ」を間違えたり、人名の苗字だけしか入力されていなかったり、郵便番号が最初の3桁しか入力されていない、等々、間違いや揺らぎや欠損には、さまざまなパターンがあります。

  • また集計したデータが他のデータと整合していない、複数のデータソースから統合したデータに矛盾がある、といった可能性もあるでしょう。

  • こうしたデータの誤りの割合は少なくても、それが蓄積されていくことで、マーケティング精度や顧客サービスの質の低下を招き、データの分析による営業成績の確認や経営分析の精度が疑われるようになってしまいます。

  • ■データ品質の改善には開発者と業務担当者の協力が必要

    こうしたデータの揺らぎ、欠損、矛盾などをロジックによって発見することが可能です。また発見したデータの確認と修正、補完の作業は実際にそのデータを扱っている業務担当者自身が確認することによって、より精度の高いクレンジングが可能となります。Data Qualityは、ロジックの開発を行う開発者のためのツールはもちろんのこと、データの修正や補完作業を行う業務担当者のためのツール、そして両者が協力するための環境を提供します。

 

図:Data Quality Assistantの使用例   >>クリックして拡大

Data Quality Assistantの使用例

開発者が作成したチェックロジックにより確認が必要とされたデータは、
自動的に業務担当者の確認画面に表示され、修正が行われる。

 

図:Data Qualityによって実現されるデータ品質管理プロセス

Data Qualityによって実現されるデータ品質管理プロセス

 

01 02 次のページへ →