减少 Hadoop 解析的时间和成本

HParser 是针对 Hadoop 的优化数据转换(数据处理器)环境。 这款易用的无代码解析软件能够大规模和高效率地实现 Hadoop 内部任何文件格式的处理。 它为 Hadoop 开发人员提供即开即用的 Hadoop 解析功能,可处理各种复杂的数据来源,包括日志、行业标准、文档和二进制或层次数据。

  • 轻松访问复杂的数据来源,开发适用于 Hadoop 解析的数据转换,提供更广泛的数据格式支持
  • 消除在 Java 和 PERL 中开发和测试数据转换的耗时、繁琐的流程
  • 在 MapReduce 任务内执行 HParser 运行时,实现最高的性能和可扩展性

HParser 主要功能

Data Transformation Studio

  • 专用、直观、高效的环境,使用简单的“点击”、“标记并映射”流程定义解析
  • 适用于 Hadoop 解析的二进制视图和文档预处理器,提取锁定在二进制格式中的数据,包括打包数据、PDF 文件、Microsoft Word 文档和 Microsoft Excel 文档

数据格式转换库

  • 针对支持行业标准格式的即开即用 Hadoop 解析,包括 Bloomberg、SWIFT、NACHA、HIPAA、HL7、ACORD、EDI X12 和 EDIFACT,以及适用于 Hadoop 解析的 Web 日志、专有日志、ASN.1 和 FIX 日志预打包转换
  • 针对层次数据(包括 JSON 和 XML)的本地支持

嵌入式数据转换引擎

  • 高级的本地流式处理和拆分功能可有效地处理任何格式和大小的文件
  • 集成的 HParser 使 MapReduce 任务能够通过单个数据抽象层处理不同的数据格式

提供三个版本

  • HParser for Logs, Omniture, XML and JSON(社区版)– 免费提供,并有 Informatica 支持和附加功能可供购买
  • HParser for Industry Standards(商业版)
  • HParser for Documents(商业版)

服务和培训        

Informatica 提供了一系列服务和培训来帮助您最大化环境中的 Informatica 平台的价值。

了解更多服务信息

产品宣传        

HParser 资料

所有资料
获取真知灼见
了解更多