Познакомьтесь с Hadoop

David Lyle

Оцените риски и сложности, которые может привнести инновационное решение в уже сложную систему Больших Данных.

О появлении Больших Данных говорят как с восхищением, так и с ужасом. Организации, которые попытались обуздать объем, скорости и разнообразие Больших Данных быстро и креативно, получают неоспоримое конкурентное преимущество. Компании, которые не справляются с проблемами интеграции и анализа данных, сталкиваются с повышением затрат, сложности и рисков.

Вы можете помочь бизнесу избежать сложностей, связанных с проектами Больших Данных. Будьте осторожны, внедряя непроверенные, хотя и инновационные, технологии, такие как Hadoop.

Большие Данные

Без сомнения, вы постоянно сталкиваетесь с проблемами при интеграции неструктурированных данных из различных источников, таких как социальные сети и мобильные устройства, и вам требуется их решение. Hadoop — это инновационное решение. Поддержка данных всех типов, использование открытого исходного кода и реклама в СМИ производят огромное впечатление.

«Большинство организаций все еще находятся на начальном этапе работы с Большими Данными, и только некоторые из них рассмотрели возможность использования корпоративного подхода или проанализировали значительное влияние, которое Большие Данные окажут на их инфраструктуру, организации и отрасли1», — говорит Дуглас Лейни (Doug Laney), вице-президент по исследованиям компании Gartner.

Начните с малого

Hadoop создаст некоторые сложности даже для самых инновационных разработчиков. Программы обучения и сертификации недостаточно распространены, а передовые практики еще не установлены. Использование Hadoop и внедрение этого решения в существующую среду потребует соответствующего обучения и планирования.

Но не отчаивайтесь — вы не одиноки. Большинство разработчиков хотят поближе познакомиться с Hadoop и Большими Данными. Так же, как вы профилируете и очищаете данные перед их интеграцией, вы должны проанализировать и оценить Hadoop перед внедрением решения в свою среду. В противном случае вы можете только повысить риски и сложность.

Hadoop можно использовать для анализа очень больших объемов данных. Тем не менее, решение не может работать с метаданными, поэтому ваши данные должны быть точными, согласованными и проверенными. Решение также не предоставляет возможности занесения в журнал, регистрации событий, администрирования, обеспечения безопасности, прозрачности и помощи при настройке. В таком случае очень пригодятся ваши навыки работы с проверенными моделями, такими как ETL.

Ваш опыт позволит вам в полной мере воспользоваться всеми возможностями Hadoop и повысить свою квалификацию по мере развития технологии. Чтобы узнать больше, ознакомьтесь со статьей «7 reasons a seasoned developer is an asset to any big data project» (7 причин, по которым опытный разработчик незаменим для проекта Больших Данных).

Чтобы узнать больше о том, как подготовиться к работе с Большими Данными, ознакомьтесь с брошюрой «Preparing for the Big Data Journey» (Подготовка к переходу к Большим Данным).

Материалы статьи

Так же, как вы профилируете и очищаете данные перед их интеграцией, вы должны проанализировать и оценить Hadoop перед внедрением решения в свою среду."