Amazon Elastic MapReduce(EMR)はHadoopを基盤とし、高度な分散環境でファイルを保存してデータを処理することが可能な実績の高いテクノロジーを提供します。データソースが数多くあり、データのタイプも異なる場合、Hadoopを基盤とするデータレイクで分析するのが最適な方法です。データレイク構築の最初のステップは、複数のデータソースにあるデータをAmazon EMRにロードすることです。次のステップが、これらのデータの分析です。ほとんどのHadoopクラスタが数テラバイトのデータで構成されており、Amazon Redshiftの圧縮機能は、こうした大量のデータを手際よく分析する上で大変役立ちます。Informatica Intelligent Cloud Servicesのプッシュダウン オプティマイゼーションは、これらの使用事例に最適なテクノロジーです。
今すぐはじめる