2022年のクラウドデータマネジメントの課題と優先順位トップ3
クラウドデータマネジメントが重要な理由
企業が、昨今よりクラウド中心となる中、新しいデータユーザー(ビジネスアナリスト、データサイエンティストなど)の出現などにより、すべてのデータを管理するための適切なツールとプロセスを持つことが重要となっています。
適切なクラウドデータマネジメント戦略とソリューションを導入することで、以下のような競争上の優位性を実現することができます。
- 統合と取り込みの改善による分析の強化
- データセキュリティとデータガバナンスの強化
- ガベージイン、ガベージアウトの問題を回避するためのデータ品質の向上
- 迅速なデータ発見とメタデータ管理の強化
- システム全体にわたる記録の維持・管理の最適化
インフォマティカでは最近、さまざまな業界のデータリーダーを対象に調査を実施しました。
以下は、現在のデータ管理の課題と優先順位に関する調査結果です。
データマネジメントの課題トップ3
クラウドデータマネジメントプラットフォーム、ツール、ポリシー、手順を導入して、組織のデータを管理することは簡単ではありません。
現在、企業が直面している主な課題を見てみましょう。
#1. 複雑性
データリーダーの55%は、新しいテクノロジーやパターンの導入に苦労しています。
複雑なデータスケープから複雑な価格設定や隠れたクラウド料金まで、クラウドデータマネジメントのあらゆる側面に複雑さが浸透しています。
クラウドの導入が加速する中、データおよびITリーダーは、クラウドやマルチクラウドとオンプレミス環境との接続が困難であると感じています。
また、バラバラのツールではうまく機能しません。また、システム統合、データ品質、DataOpsの問題から、開発から本番環境へのプロジェクト移行に時間がかかりすぎることもしばしばです。
#2. リソースの制約
データリーダーの50%が、クラウドデータマネジメントのための十分なスキルを持ったテクニカルリソースがないと考えています。
CIOとCDOは、データハングリーな組織が要求するすべての作業を行うために十分なリソースを確保するという課題に直面しています。
多くの場合、こうした作業には高度なスキルと専門性を備えたリソースが必要です。IT部門が要求に応えようと奮闘する一方で、ビジネス部門はクラウドへの移行をさらに加速させたいと考えています。リソースとセルフサービス機能の不足により、ITがボトルネックになっているのです。
#3. コスト超過
データリーダーの32%が、クラウドデータマネジメントには高い運用コストがかかると回答しています。
大量のデータをクラウドに出し入れするには、コストがかかります。CIOやその他のITリーダーは、クラウドのコストを管理することはおろか、予測することも困難だと感じています。また、誰がどのようなクラウドサービスをどの程度利用しているのか、コストの可視化もできていないことが多くあります。
クラウドデータウェアハウスやクラウドレイクへのデータの出し入れには、多額のデータ転送料がかかります。
このようなデータ処理の問題に対して、企業は費用対効果の高い解決策を見出すことなく、単に人員と計算時間を投入しているケースが非常に多くなっています。
クラウドデータマネジメントの優先順位トップ3
今日の競争環境において、ビジネス要件とプロセスは常に変化しています。そこで、今日、企業が重点的に取り組んでいるデータマネジメントの優先順位のトップ3をご紹介します。
#1. データの取り込み
データリーダーの75%は、異なるソースからクラウドに大量のデータを取り込むことを優先しています。
データ取り込みとは、データベース、ファイル、ストリーミング、変更データ取り込み(CDC)、アプリケーション、IoT、マシンログなど、さまざまなソースからデータを移動して複製するプロセスです。
クラウドデータレイクやクラウドデータウェアハウスなどのランディングゾーンやローゾーンに移動し、ビジネスインテリジェンスや高度な分析に対応するための下流トランザクションに使用できるようにします。企業はクラウドのモダナイゼーションに着手する際、レガシーデータや異種データソースの増加、データ量、速度、統合サイロにまつわる課題に直面します。このため、データの取り込みが最大の障害となっています。
#2. データ統合
データリーダーの67%は、さまざまなソースからのデータの統合を優先することが重要であると考えています。
データをランディングゾーンやローゾーンに取り込んだら、データを解析、フィルタリング、変換して、高度な分析やAI活用に利用できるようにする必要があります。そこで登場するのがデータ統合です。
システムやアプリケーション間で、異なるデータの種類や形式を転送し、同期するのに役立ちます。データ統合は1回で終わるイベントではなく、ビジネス要件、テクノロジー、フレームワークの変化に合わせて進化し続ける継続的なプロセスです。データ形式やデータソースが時間とともに増加しているため、企業はデータ統合を困難なものと感じているかもしれません。また、低品質なデータ、古いデータ、サイロ化したデータの増加もデータ統合の懸念材料です。
#3. データ品質
データ品質とは、データセットの全体的な有用性と、他の用途のために容易に処理および分析できる能力を指します。完全性、適合性、一貫性、正確性、完全性などのデータ品質の次元を管理することで、アナリティクスやAI/MLイニシアティブが信頼できる結果をもたらすことができます。データ品質の問題は、データベースの統合やシステム/クラウドの統合プロセスで、スキーマやフォーマットの不整合により、互換性があるはずのデータフィールドが互換性を失っていることがよくあります。
データの品質が優れていれば、データの処理と分析が容易になり、組織がより良い意思決定を行うためのインサイトを導き出すことができます。