Hadoop 解析の時間とコストを削減

HParser は、Hadoop 用に最適化されたデータ変換(データハンドラ)環境です。使いやすいコードレス解析ソフトウェアで、Hadoop 内のあらゆるファイル形式を、スケーラブルかつ効率的に処理できるようになります。すぐに使える Hadoop 解析機能では、ログ、業界標準、文書、バイナリデータや階層データなど、多様で複雑なデータソースに対応します。

  • 広範なデータ形式をサポートし、複雑なデータソースへのアクセスと Hadoop 解析のためのデータ変換の開発を簡素化します
  • Java と PERL でデータ変換を開発、テストするといった時間のかかる面倒なプロセスが不要になります
  • HParser を MapReduce タスク内でランタイムに実行して、最大のパフォーマンスと拡張性を実現します

HParser の主な機能

Data Transformation Studio

  • ビジュアルで効率的な作業をサポートする専用環境で、簡単なポイント&クリック、マーク&マッププロセス操作で解析を定義することができます。
  • Hadoop 解析用のバイナリビューとドキュメントプリプロセッサにより、パックデータ、PDF ファイル、Microsoft Word 文書、Microsoft Excel 文書など、バイナリ形式に固定されたデータを抽出します。

データ形式変換ライブラリ

データ変換エンジンを内蔵

  • 高度なネイティブのストリーミング機能と分割機能により、あらゆる形式とサイズのファイルを効率的に処理します。
  • 統合HParserにより、1 つのデータ抽象化レイヤーで様々なデータ形式に対応できるMapReduce タスクを実現

3 つのエディションを提供

  • HParser for Logs, Omniture, XML and JSON:ログ、Omniture、XML 、JSON 用の HParser(Community Edition)を無償で配布。Informaticaの サポートとアドオン機能は有料になります。
  • HParser for Industry Standards:業界標準対応の HParser(Commercial Edition)
  • HParser for Documents:ドキュメント対応の HParser(Commercial Edition)

サービスとトレーニング

Informatica では、お客様の環境で Informatica プラットフォームの価値を最大化する豊富なサービスおよびトレーニングを提供しています。

サービスについて詳しくはこちら