| 01 02 | 次のページへ → |
多くの企業では、さまざまなデータが分散して存在します。営業部が管理する顧客や販売のデータ、経理部門が管理する売上げや経費のデータ、出荷部門が管理する在庫と流通データ、製造部門が管理する仕入れや製品のデータなどです。
システムインテグレーションにはデータ統合の課題が存在する
INFORMATICA製品概要
INFORMATICA の製品群は、次の3つの製品から構成されています。
基本的にINFORMATICA PowerExchangeとINFORMATICA PowerCenterはセットで利用し、データ統合の要求に応じてINFORMATICA Data Qualityを追加として用います。
図:INFORMATICAが構成する3つの製品の全体像
個々の製品について詳しく紹介しましょう。
INFORMATICA PowerCenter
PowerCenterは、データ統合に必要なすべてのロジックの設計を行うことができます。具体的には、PowerExchangeによるデータソースへの接続を管理し、受け取ったデータの変換、統合、差分抽出などのデータ操作、およびそれらのリアルタイム処理、バッチ処理などの実行処理、そして高可用性の提供などを実現します。
INFORMATICA PowerExchange
PowerExchangeはメインフレームやパッケージソフト、データベース、フラットファイルなど、企業内で利用されているあらゆるデータソースへ接続できる機能を備えています。
多くのシステム統合プロジェクトではデータソースへの接続や変換のために個別のソフトウェアが開発される傾向にありますが、PowerExchangeを用いることでそうした手間と時間、そして継続的なコストのかかるメンテナンス要員の確保などが不要になります。インフォマティカがこれまで蓄積してきたさまざまなデータソースへの接続技術が集約されたソフトウェアは、何よりも信頼性が高く高速な接続を実現します。
図:PowerExchangeでサポートする主なデータソース
PowerExchangeがサポートしているのは、いわゆるデータベースに格納されている構造化されたデータだけではなく、XML文書などの半構造化データや文書など非構造化データ、メッセージングデータなども含まれます。企業で扱うあらゆるデータタイプのデータソースをカバーしています。
この設定はグラフィカルな操作によって簡単に行うことが可能です。
また、実際にデータ操作のロジックを確認するため、各段階でどのようにデータが加工されているかを確認でき、また実行ログも取得できるため、効率よくロジックの設計、デバッグが行えます。もちろん、ロジックはすべてバージョン管理の対象であり、データソースやロジックの部品化もでき、大規模な開発にも対応することが可能です。
また処理中にエラーが発生しても、データの整合性や一貫性を確実に担保しつつ処理を継続するトランザクション機能、フェイルオーバーによって別のサーバが処理を引き継ぐ高可用機能などを備えています。
INFORMATICA Data Quality
Data Qualityは、データの欠損、揺らぎ、矛盾や重複といったデータの品質を下げる要素を取り除き、高いデータ品質のアウトプットを実現します。
企業が扱うデータには、ときに間違いや揺らぎや欠損があります。例えば同じ企業なのに前株や後株の表記を間違って二重に入力されていたり、英語のスペルが微妙に間違っていたり、小さな「ヵ」と大きな「カ」を間違えたり、人名の苗字だけしか入力されていなかったり、郵便番号が最初の3桁しか入力されていない、等々、間違いや揺らぎや欠損には、さまざまなパターンがあります。
また集計したデータが他のデータと整合していない、複数のデータソースから統合したデータに矛盾がある、といった可能性もあるでしょう。
こうしたデータの誤りの割合は少なくても、それが蓄積されていくことで、マーケティング精度や顧客サービスの質の低下を招き、データの分析による営業成績の確認や経営分析の精度が疑われるようになってしまいます。
こうしたデータの揺らぎ、欠損、矛盾などをロジックによって発見することが可能です。また発見したデータの確認と修正、補完の作業は実際にそのデータを扱っている業務担当者自身が確認することによって、より精度の高いクレンジングが可能となります。Data Qualityは、ロジックの開発を行う開発者のためのツールはもちろんのこと、データの修正や補完作業を行う業務担当者のためのツール、そして両者が協力するための環境を提供します。
図:Data Quality Assistantの使用例 >>クリックして拡大
開発者が作成したチェックロジックにより確認が必要とされたデータは、
自動的に業務担当者の確認画面に表示され、修正が行われる。
図:Data Qualityによって実現されるデータ品質管理プロセス

| 01 02 | 次のページへ → |