Оцените риски и сложности, которые может привнести инновационное решение в уже сложную систему Больших Данных.
О появлении Больших Данных говорят как с восхищением, так и с ужасом. Организации, которые попытались обуздать объем, скорости и разнообразие Больших Данных быстро и креативно, получают неоспоримое конкурентное преимущество. Компании, которые не справляются с проблемами интеграции и анализа данных, сталкиваются с повышением затрат, сложности и рисков.
Вы можете помочь бизнесу избежать сложностей, связанных с проектами Больших Данных. Будьте осторожны, внедряя непроверенные, хотя и инновационные, технологии, такие как Hadoop.
Большие Данные
Без сомнения, вы постоянно сталкиваетесь с проблемами при интеграции неструктурированных данных из различных источников, таких как социальные сети и мобильные устройства, и вам требуется их решение. Hadoop — это инновационное решение. Поддержка данных всех типов, использование открытого исходного кода и реклама в СМИ производят огромное впечатление.
«Большинство организаций все еще находятся на начальном этапе работы с Большими Данными, и только некоторые из них рассмотрели возможность использования корпоративного подхода или проанализировали значительное влияние, которое Большие Данные окажут на их инфраструктуру, организации и отрасли1», — говорит Дуглас Лейни (Doug Laney), вице-президент по исследованиям компании Gartner.
Начните с малого
Hadoop создаст некоторые сложности даже для самых инновационных разработчиков. Программы обучения и сертификации недостаточно распространены, а передовые практики еще не установлены. Использование Hadoop и внедрение этого решения в существующую среду потребует соответствующего обучения и планирования.
Но не отчаивайтесь — вы не одиноки. Большинство разработчиков хотят поближе познакомиться с Hadoop и Большими Данными. Так же, как вы профилируете и очищаете данные перед их интеграцией, вы должны проанализировать и оценить Hadoop перед внедрением решения в свою среду. В противном случае вы можете только повысить риски и сложность.
Hadoop можно использовать для анализа очень больших объемов данных. Тем не менее, решение не может работать с метаданными, поэтому ваши данные должны быть точными, согласованными и проверенными. Решение также не предоставляет возможности занесения в журнал, регистрации событий, администрирования, обеспечения безопасности, прозрачности и помощи при настройке. В таком случае очень пригодятся ваши навыки работы с проверенными моделями, такими как ETL.
Ваш опыт позволит вам в полной мере воспользоваться всеми возможностями Hadoop и повысить свою квалификацию по мере развития технологии. Чтобы узнать больше, ознакомьтесь со статьей «7 reasons a seasoned developer is an asset to any big data project» (7 причин, по которым опытный разработчик незаменим для проекта Больших Данных).
Чтобы узнать больше о том, как подготовиться к работе с Большими Данными, ознакомьтесь с брошюрой «Preparing for the Big Data Journey» (Подготовка к переходу к Большим Данным).
Материалы статьи
- 1Gartner, «Gartner Survey Finds 42 Percent of IT Leaders Have Invested in Big Data or Plan to Do So Within a Year» (По результатам опроса Gartner 42% ИТ-руководителей инвестировали в Большие Данные или планируют сделать это в течение года), 12.03.2013 г.
Так же, как вы профилируете и очищаете данные перед их интеграцией, вы должны проанализировать и оценить Hadoop перед внедрением решения в свою среду."