c01-big-data-v2

Enterprise Data Lake

Ermitteln und bereiten Sie Rohdaten vor, um sie immer und immer wieder in hochwertige Erkenntnisse umzuwandeln.

Übersicht

key-features-icon.png

Die wichtigsten Features

Daten können nun auf einzigartige gemeinschaftliche Weise zu Analysezwecken gesucht, vorbereitet und geschützt werden, was Unternehmen eine noch schnellere Entscheidungsfindung ermöglicht.

Vertraute Excel-artige Oberfläche

Benutzerfreundliche Oberfläche, die es Business-Analysten ermöglicht, Daten auch ohne die Hilfe der IT zusammenzuführen.

Schnelles Zusammenführen von Datensätzen

Mit vorgefertigten Umwandlungsfunktionen für die Datenintegration zur nativen Verarbeitung von Daten jeden Typs und Umfangs.

Asset-Kennzeichnung und Weitergabe von Crowdsourcing-Daten

Ermöglicht Analysten die Zusammenarbeit während des Datenpflegeprozesses durch die einfache Kennzeichnung und Weitergabe von Datenbeständen.

Automatisierte Datenerkennung

Verwendung von Maschinenintelligenz zur Lokalisierung schwer auffindbarer Datenbestände und Identifizierung sensibler Daten für Compliance.

Automatisierte Workflow-Erstellung

Die zur Datenaufbereitung erforderlichen Schritte werden als wiederverwendbare Data Pipeline Mappings aufgezeichnet, die mithilfe von Informatica Blaze oder anderen Engines schnell ausgeführt werden können.

Datentransfer mit Self-Service-Funktionen aus Sqoop

Ermöglichung der bidirektionalen Einspeisung und Veröffentlichung von Daten zwischen Hadoop und Apache Sqoop-Quellen mittels Self-Service-Funktionen.

Verwaltung und Autorisierung von Benutzern

Unterstützung der zentralen Sicherheitsadministration von Apache Ranger und der rollenbasierten Zugangskontrolle von Apache Sentry.

Automatisierte Datenqualität

Einschließlich vorgefertigter Transformationen von Geschäftsregeln für die Datenqualität, um Konsistenz und Genauigkeit sicherzustellen.

Intelligente Diagramme

Datenexploration dank einer übersichtlichen visuellen Darstellung der Daten.

Unternehmensweite Zusammenarbeit

Self-Service-Verwaltung von Datenveröffentlichungen, wobei Projekte in Workspaces unterteilt werden.