„Hallo Welt!“ – Begrüßen Sie Hadoop

David Lyle

Verstehen Sie die inhärenten Risiken und Komplexitäten, die eine innovative Lösung für bereits komplexe Big Data-Initiativen bedeuten kann.

Die „Ankunft“ von Big Data wurde sowohl mit Aufregung als auch mit Angst erwartet. Unternehmen, die Volumen, Geschwindigkeit und Verschiedenartigkeit von Big Data mit Energie und Kreativität erfolgreich angehen, werden sich einen unbestreitbaren Wettbewerbsvorteil verschaffen. Unternehmen, die durch Probleme bei der Datenintegration und -analyse behindert werden, sehen sich Kosten, Komplexitäten und Risiken ausgesetzt.

Sie können eine Führungsrolle einnehmen, indem Sie das Unternehmen durch die Komplexität eines Big Data-Projekts leiten. Gehen Sie potenziellen Fallen aus dem Weg, und seien Sie vorsichtig, wenn Sie unbewährte, wenngleich innovative Technologien wie Hadoop ins Spiel bringen.

Der Hype um Big Data

Zweifellos sind Sie jeden Tag mit Herausforderungen konfrontiert, wenn es gilt, unstrukturierte Daten aus verschiedenen Quellen wie sozialen Medien und mobilen Geräten zu integrieren, und würden eine Lösung dafür natürlich begrüßen. Und Hadoop ist eine bedeutende Innovation. Die Unterstützung für sämtliche Datentypen und die Open Source-Wurzeln von Hadoop sowie der darum entstandene Medien-Hype klingen verheißungsvoll.

„Die meisten Unternehmen stecken noch in der Frühphase, und nur wenige verfolgen einen durchdachten Unternehmensansatz oder sind sich der tief greifenden Auswirkungen bewusst, die Big Data für ihre Infrastruktur, für Unternehmen und Branchen haben wird“1, meint Doug Laney, Vice President, Research, bei Gartner.

Klein anfangen

Hadoop wird selbst für die innovativsten Entwickler eine Herausforderung sein. Schulungs- und Zertifizierungsprogramme sind dünn gesät, und optimale Vorgehensweisen müssen erst noch etabliert werden. Die Aufnahme von Hadoop als Ergänzung Ihrer Fertigkeiten sowie der bestehenden Umgebung wird Schulung und Planung erfordern.

Doch seien Sie unbesorgt – Sie sind nicht alleine. Viele Entwickler suchen nach einer „Hallo Welt!“-Einführung in Hadoop und Big Data. Aus denselben Gründen, aus denen Sie vor der Integration ein Data Profiling durchführen und Daten bereinigen, müssen Sie Hadoop zunächst verstehen und evaluieren, bevor Sie das Framework in Ihrer erweiterten Umgebung einführen. Anderenfalls öffnen Sie vielleicht unnötigen Risiken und Komplexitäten die Tür.

Hadoop kann natürlich zur Analyse von großen Datenvolumen verwendet werden. In Hadoop werden jedoch keine Metadaten verwaltet, deshalb müssen Ihre Daten bereinigt, konsistent und zuverlässig sein. Ferner fehlt es an Protokollen, Verwaltung und Sicherheit sowie an der Transparenz von Operationen und der Hilfe bei der Datenbankoptimierung. An dieser Stelle werden sich Ihre Kenntnisse von bewährten Modellen wie ETL (extract, transform, load) als wertvoll erweisen.

Dank Ihrer Erfahrung sind Sie in der idealen Lage, das Beste zu übernehmen, was Hadoop gegenwärtig zu bieten hat, und Ihre Fertigkeiten auszubauen, während Hadoop als Technologie heranreift. Wenn Sie weitere Sicherheit gewinnen möchten und detailliertere Informationen wünschen, lesen Sie den Artikel „7 Gründe, warum ein erfahrener Entwickler für jedes Big Data-Projekt ein Vermögen wert ist“.

Wenn Sie sich genauer informieren möchten, wie Sie sich auf Big Data vorbereiten können, lesen Sie das White Paper „Vorbereitung auf die Big Data-Reise“.

Aus denselben Gründen, aus denen Sie vor der Integration ein Data Profiling durchführen und Daten bereinigen, müssen Sie Hadoop zunächst verstehen und evaluieren, bevor Sie das Framework in Ihrer erweiterten Umgebung einführen."