ビジネスを進化させる要素として存在感を増すデータ、その信頼性がビジネスの成功に与える影響は大きくなるばかりです。データ資産を効率的に分析・評価し、データ品質を改善してデータの信頼性を担保することは、経営・業務における意思決定の精度向上やデータ移行などのプロジェクトリスクの低減につながります。
データの品質には6つの評価基準があります。
- 完全性 - どのデータが消失しているか。使用されていないか。
- 適合性 - どのデータが標準フォーマット外で格納されているか。
- 一貫性 - どのデータが情報に不整合を生じさせているか。
- 精度 - どのデータが間違っているか。失効しているか。
- 重複度 - どのデータ、どのカラム属性が重複しているか。
- 関連性 - 各データ間の関連性はどうなっているか。
本デモでは、これらを効率的に分析・評価するデータプロファイリングについてご紹介します。