データ統合の前後で、発生し得る問題を回避するためには、適切なソフトウェアツールを使用することが必須です。
リスクの回避やプロジェクトの遅延を回避するための最善の準備は、詳細設計に入る前に問題を見つけ出すことです。業務上の課題やスケジュールの早期化のために、データ検出の重要性を軽視してはいけません。
データ検出は、緻密な作業なため、時間がかかる可能性があります。ベストプラクティスを無視すれば、機密データがリスクにさらされ、コンプライアンスの問題やプロジェクトの失敗につながるリスクもあります。 さらに、プロジェクトの失敗につながる恐れもあります。ITの視点を持つ開発者と業務の視点を持つデータアナリストが協力して取り組むことが、最良のアプローチです。統合の開始前だけでなく、実施中も、データ検出を目的としたツールを使用することが重要です。
水際でプロファイルする
ビジネスの意思決定に必要なデータの量や種類は増え続けています。IT部門は、ビジネス要件への対応能力を高めることが求められています。業務部門からの協力を得るには、業務責任者がデータに対する理解と分析を自分で行えるようなツールが必要です。そうすれば、統合開始前のコミュニケーション不足や誤解をなくすことができます。
その場でデバッグ
統合プロセスの間は、継続的に異常を検出し、データ品質を追跡管理します。こうしたプラクティスを無視すると、コンプライアンス違反やセキュリティ脅威などの問題が発生するリスクを招きます。
Securosis社のセキュリティ・ストラテジストのAdrian Lane氏は、次のように述べています。「データ検出ツールは、機密データの保管場所を管理する上で、重要性を増しています。たとえば、4万件のテーブルがある運用データベースのスキーマで、テーブルを作成した開発者がほとんど文書化していなければ、単体のデータベースで情報を検索することでさえ大変な作業になります。しかも、財務、人事、業務処理、テスト、意思決定サポートといった各種データベースになれば、問題は何倍にも深刻化し、とんでもないトラブルを抱え込むことになります」。1
適切なツールの選択
現在、Big Dataは大規模なビジネスとなっており、一部のソフトウェアベンダーは、自社製品をデータ検出ソリューションとして位置づけています。優れたツールを使用したとしても、データ品質の問題の検出は複雑であるため、リサーチを行っておくことが大切です。
たとえば、ビジネスインテリジェンス(BI)ソフトウェアは、便利なチャートやグラフを表示しますが、本来検出ツールが提供する自動化機能はありません。データ品質や連携の有効性の評価、ビジネスプロセスとデータの関連性の理解を視覚的に行う必要があります。複数システムのデータ間を関連付けしてデータ構造の基盤を明らかにするためには、専門かつ高度な機能を備えたソフトウェアが必要です。
業務部門は、競争力を維持するためにプロジェクトを早期化するように強く求められています。しかし、プロセス全体にわたるデータのプロファイリングを確実な頻度で行わなければ、長期的な効率性を損なうことになります。ベストプラクディスの詳細については、「Double Productivity with Integrated Data Discovery, Profiling and Data Quality.(統合データ検出、プロファイリング、データ品質で生産性を2倍に向上)」をご覧ください。
資料
- 1「What Data Discovery Tools Really Do」、Adrian Lane著、Dark Reading、2010年1月20日
業務上の課題やスケジュールの早期化のために、データ検出の重要性を軽視してはいけません。