Hadoop 구문 분석의 시간 및 비용 절감

HParser는 Hadoop에 최적화된 데이터 변환(데이터 처리 장치) 환경입니다. 사용이 편리한 코드 없는 구문 분석 소프트웨어를 통해 Hadoop 내 모든 파일 형식을 광범위하게 효율적으로 처리할 수 있습니다. Hadoop 개발자에게 로그, 업계 표준, 문서 및 바이너리 또는 계층 데이터를 포함하는 데이터 소스의 다양성 및 복잡성을 처리할 수 있도록 설치 즉시 사용 가능한 Hadoop 구문 분석 기능을 제공합니다.

  • 폭넓은 데이터 형식 지원으로 복잡한 데이터 소스에 손쉽게 액세스하여 Hadoop 구문 분석에 대한 데이터 변환 개발
  • Java 및 PERL에서 데이터 변환 개발 및 테스트하는 시간 소모적이고 지루한 프로세스 제거
  • MapReduce 작업 내에서 HParser 런타임을 실행하여 최대 성능 및 확장성 실현

HParser 주요 기능

Data Transformation Studio

  • 목적 지향 설계, 시각적 효과가 뛰어난 생산 환경 및 간편한 포인트 앤 클릭(Point-and-Click), 표시 및 매핑 프로세스를 활용하여 구문 분석 정의
  • 바이너리 보기 및 Hadoop 구문 분석을 위한 문서 사전 프로세서를 사용하여 패키징된 데이터, PDF 파일, Microsoft Word 문서 및 Microsoft Excel 문서를 포함한 바이너리 형식으로 잠긴 데이터를 추출

데이터 형식 변환 라이브러리

내장 데이터 변환 엔진

  • 고급 네이티브 스트리밍 및 분할 기능으로 형식에 관계없이 모든 크기의 파일을 효과적으로 처리/li>
  • 통합 HParser로 단일 데이터 추상 계층을 통해 다른 데이터 형식을 처리하는 MapReduce 작업 가능

세 가지 에디션으로 제공

  • 로그, Omniture, XML 및 JSON(커뮤니티 에디션)에 대한 HParser – 무료(인포매티카 지원 및 추가 기능 별도 구매)
  • 업계 표준에 대한 HParser(상업용 에디션)
  • 문서에 대한 HParser(상업용 에디션)

서비스 및 교육

인포매티카는 고객의 환경에 구축된 인포매티카 플랫폼의 가치를 극대화할 수 있는 다양한 서비스와 교육을 제공하고 있습니다.

서비스에 대한 자세한 정보

HParser 블록(Block)

모든 블록(Block) 보기
Informatica World
Early Bird Discount
Expires March 2, 2012
Register now