O Amazon Elastic MapReduce (EMR) é baseado no Hadoop e oferece uma tecnologia comprovada para armazenar arquivos e processar dados de maneira altamente distribuída. Quando você se depara com diversos tipos de dados, provenientes de uma infinidade de fontes, um reservatório baseado no Hadoop para analisar os dados faz todo o sentido. Carregar dados de várias fontes no Amazon EMR é o primeiro passo para a formação de um reservatório de dados. O próximo passo é analisar esses dados. Considerando que a maioria dos clusters Hadoop é composta por vários terabytes de dados, os recursos de compactação do Amazon Redshift podem ajudar a dar sentido ao enorme volume de dados contidos nesses clusters. A tecnologia de otimização de empilhamento do Informatica Intelligent Cloud Services é adequada para ambos os casos de uso.
Comece agora