Big Data Parser von Informatica sorgt mit beispielbasierten Umwandlungen für enorme Produktivitätssteigerungen. Die Anwender sehen ein Datenmuster im Original und in Textformaten, so dass eine kontinuierliche Weiterentwicklung des Parsers oder Daten-Handlers möglich wird. So erhält der Anwender umgehend Feedback, ohne eine Kompilierung oder Bereitstellung vornehmen zu müssen.
Mit Big Data Parser von Informatica wird die Entwicklung unter Hadoop im Vergleich zum manuellen Programmieren um das bis zu Fünffache beschleunigt, da vorgefertigte Parser für zahlreiche Branchenstandards bereitgestellt werden (z. B. FIX, SWIFT, NACHA, SEPA, ACORD, HIPAA, HL7, EDI, ASN.1). Hadoop-Entwickler können mit einem einfachen Aufruf auf die Engine von Big Data Parser zugreifen, so dass die Analyse beliebiger Datenformate in Hadoop möglich wird.
Mit Big Data Parser von Informatica wird eine visuelle Entwicklungsumgebung bereitgestellt, über die strukturierte und halb strukturierte Formate schnell analysiert und in ein nutzbares, vorschriftsmäßiges und vereinfachtes Format umgewandelt werden können. Mit Big Data Parser können Hadoop-Entwickler statt mehrerer codierter Daten-Handler eine einzige Engine für die Datenumwandlung nutzen, um ein von den Datenvariationen vollständig unabhängiges Einzelprogramm zu entwickeln.
Analysieren Sie verschieden strukturierte und Industriestandard-Daten in Hadoop, u.a. Industriestandard-Dokumente, Protokolldateien und komplexe Dateiformate.
Analyse verschiedenster Branchenstandards, Dokumente, Protokolldateien und komplexer Dateiformate in Hadoop
Verwenden Sie vorgefertigte Parser, oder erstellen Sie mit Big Data Parser Studio benutzerdefinierte Parser, und testen Sie die Analyseumwandlungen anschließend mit Versuchsdaten.
Unterstützt mehrere Branchenstandards (z. B. FIX, SWIFT, NACHA, SEPA, ACORD, HIPAA, HL7, EDI, ASN.1)
Extrahieren von Daten aus Binärdokumenten wie Microsoft Office- und Adobe PDF-Dateien in Hadoop
Verarbeitung tiefer hierarchischer Datenstrukturen – z. B. in den Formaten XML und JSON – in Hadoop.
Analysieren und Extrahieren von Daten aus verschiedensten Protokolldateien (Web, Datensätze zu Anrufdetails, Mainframe und proprietäre Systeme) in Hadoop
Verarbeitung von Analyseumwandlungen unabhängig von Datenformat oder -größe und skaliert nach der Topologie des Hadoop-Clusters
Informatica empowered scientific and clinical collaboration at this renowned cancer center by turning data into knowledge and facilitating self-service business intelligence