Hadoopへの扉を開ける

David Lyle

すでに複雑化したBig Dataの取り組みに革新的なソリューションを導入する際の潜在的リスクや複雑性のリスクを理解しましょう。

Big Dataの「到来」は、興奮と不安の両方を持って歓迎されました。エネルギーと創造性で、大容量かつ高速で多様なBig Dataへの取り組みに成功した企業は、間違いなく競争優位に立ちます。一方、データ統合と分析がうまくいかない企業は、コスト、複雑性、リスクといった問題に苦しむでしょう。

開発者は、業務部門がBig Dataの複雑性をうまく切り抜けられるように支援することで、リーダーシップを発揮することができます。たとえば、Hadoopのような、革新的でありながらも実証されていないテクノロジーを混沌としたシステムに導入する場合には、潜在的なリスクを回避するよう十分に注意しなくてはなりません。

Big Dataの過大評価

開発者は、ソーシャルメディア、モバイルデバイスなどさまざまなソースからの非構造化データの統合の課題に日々直面しているため、Hadoopのような単一のソリューションを歓迎するでしょう。確かに、Hadoopは重要なイノベーションです。あらゆるデータタイプへの対応力、オープンソースのルーツ、メディアでの高い評価が、Hadoopの魅力です。

Garnerのリサーチ部門担当副社長Doug Laney氏は、次のように述べています。「(Big Dataに関しては)多くの企業が依然として初期段階にあります。企業としてのアプローチを徹底的に検討しており、Big Dataがインフラ、組織、業界に与える重大な影響を理解している企業はほとんどありません。」1

小さくはじめる

Hadoopは、最も革新的な開発者たちにとっても、挑戦しがいのあるテクノロジーです。トレーニングや資格認定プログラムの数も少なく、ベストプラクティスもまだ確立されていません。開発者であるあなたのスキルセットと貴社の既存環境の両方にHadoopを追加するには、教育と計画が必要です。

しかし、恐れる必要はありません。なぜなら、HadoopとBig Dataを導入するための糸口を探している開発者は、あなたの他にも数多く存在するからです。データ統合の前にデータのプロファイリングとクレンジングを行うのと同様に、貴社の拡張環境にHadoopを導入する前にHadoopを理解し評価することが必要です。それを怠ると、不要なリスクや複雑性を招くことになります。

確かにHadoopは、大容量データの分析に効果を発揮しますが、メタデータ管理機能がないため、クリーンで一貫性と信頼性のあるデータを使用する必要があります。またHadoopには、ログおよび監査証跡、管理およびセキュリティ、操作の可視性、調整支援の各種機能が備わっていません。そこで、ETL(抽出、変換、ロード)などの実績あるモデルに関する開発者のスキルが活きてくるのです。

あなたは、開発者としての経験があればこそ、Hadoopが現在提供する利点を最大限活用し、テクノロジーとしてのHadoopの成熟に伴って自らのスキルを伸ばせるという絶好のポジションを確保できるのです。この点に関する詳細な解説は、「経験豊富な開発者があらゆるBig Dataプロジェクトの資産である7つの理由」をご参照ください。

また、開発者としてどのようにBig Dataに備えるべきかについて詳しくは、ホワイトペーパーPreparing for the Big Data Journey(Big Dataへの旅に備える)」をお読みください。

データ統合の前にデータのプロファイリングとクレンジングを行うのと同様に、貴社の拡張環境にHadoopを導入する前にHadoopを理解し評価することが必要です。