Amazon Elastic MapReduce (EMR), basée sur Hadoop, propose une technologie de stockage de fichiers et de traitement des données ayant fait ses preuves, disponible de façon hautement distribuée. Lorsque vous êtes confronté à un environnement dans lequel différents types de données proviennent d'une multitude de sources de données, faire le choix d'un lac de données basé sur Hadoop pour analyser les données prend tout son sens. La première étape de la création d'un lac de données consiste à charger des données provenant de nombreuses sources de données dans Amazon EMR. L'étape suivante est l'analyse de ces données. Étant donné que la plupart des clusters Hadoop regroupent plusieurs téraoctets de données, les capacités de compression d'Amazon Redshift aident à comprendre l'énorme volume de données contenu dans ces clusters. La technologie d'optimisation Pushdown d'Informatica Intelligent Cloud Services est particulièrement bien adaptée à ces deux cas d'utilisation.
Démarrer