发挥大数据的潜能,减少数据管理成本,并将风险降至最低

Informatica PowerCenter Big Data Edition 是一款具备高可扩展性与高性能的企业数据集成软件,可与 Hadoop 等新兴技术及传统的数据管理基础设施配合应用。该软件为大数据提供了安全通道,让 IT 组织能够集成和分析全新的数据类型与数据源。借助该软件,开发人员可从手动编码方式进化至无编码的虚拟开发环境,从而将工作效率提高三倍以上。数据科学家和分析师则能够将精力集中于深入地了解大数据,而不是数据集成。您的公司则可利用此等对大数据的深入了解,加快创新产品与服务的上市速度,并改善业务运营。该软件提供了一条经过实践证明的创新途径,同时还可减少大数据的管理成本,并将风险降至最低。

  • 在处理日益增长的数据量和复杂 性的同时,降低大数据管理成本
  • 通过在项目中加强采用 Hadoop, 凸显性能和成本优势
  • 通过对公认的数据集成软件的投资,使新兴技术的复杂性隐形, 将其风险降至最低

无需编码的高工作效率

  • 在 Hadoop 内以虚拟的 Informatica 开发环境取代手动编码
  • 借助共用的集成开发环境 (IDE),促进重复利用与协作

统一数据访问

  • 提供对 RDBMS、OLTP、OLAP、ERP、CRM、大型机、云和其他类型的大交易数据的访问
  • 提供对大交互数据的访问,其中包括社交媒体数据、日志文件、机器传感器数据、网站、博客、文档、电子邮件和其他非结构化或多结构化数据

高速数据导入和提取

  • 在源系统与目标系统之间,或直接在 Hadoop 或数据仓库内访问、加载、复制、转换和提取大数据
  • 通过本地 API 与源系统和目标系统的高性能接连,利用并行处理功能高速地导入和提取数据

无限可扩展性

  • 处理从太字节到拍字节规模的所有数据类型
  • 消除在 Hadoop 等分布式计算平台上开发专用编码的需求

优化性能实现最低成本

  • 在性能最高、最具经济效益的数据处理平台上(基于数据量、数据类型、延迟要求和可用硬件)部署大数据处理功能
  • 无论是在 SMP 机器、传统的网格集群、Hadoop 等分布式计算平台还是数据仓库设备上部署数据处理功能,均能实现最大的现有投资回报和能力

Hadoop 上的 提取、转换和加载(ETL)

  • 在 Hadoop 上提供广泛多样的预置转换功能,包括数据类型转换和字符串操作、高性能缓冲查找、合并工具、分类程序、路由器和聚合程序
  • 无编码的图形开发环境,可在该环境内快速开发 Hadoop 上的大数据流

Hadoop 探查

  • 运用 Informatica 开发工具和基于浏览器的分析工具,在 Hadoop 上探查数据
  • 让开发人员、分析师和数据科学家能够了解数据、识别数据质量问题、协同制定数据流规范并验证映射和规则逻辑

一步到位设计,随时随地部署

  • 让 ETL 开发人员将精力集中于数据和转换逻辑,而无需担忧 ETL 流程在 Hadoop 或传统的数据处理平台上的部署位置
  • 让开发人员能够进行一步到位的设计,无需具备任何 Hadoop 概念和语言方面的专业知识,并可轻松地在 Hadoop 或传统系统上部署数据流

Hadoop 上的复杂数据解析

  • 简化对 Web 日志、JSON、XML 和机器设备数据等复杂、多结构化、非结构化及行业标准数据的访问和解析
  • 此外,还可提供及单独授权使用用于市场数据和 FIX、SWIFT、ACORD、HL7、HIPAA和 EDI 等行业标准数据的预置解析器

Hadoop 上的实体提取和数据分类

  • 从电子邮件、社交媒体数据和文档等非结构化数据中轻松地提取和分类与客户和产品相关的实体
  • 利用对客户行为的深入了解或竞争性定价等产品信息丰富主数据

混合工作流

  • 让 IT 团队能够轻松地协调、调度、监控和管理跨传统环境和 Hadoop 环境的所有交互式流程和工作流
  • 深入探查单个 Hadoop 作业

高可用性

  • 通过无缝故障切换、灵活复原和连接弹性,提供全天候的高可用性
  • 确保通过对大数据的深入了解而开发的新产品和服务能够加以扩展,并可为任务关键型运营提供全天候的可用性

服务和培训        

Informatica 提供了一系列服务和培训来帮助您最 大化环境中的 Informatica 平台的价值。

了解更多服务信息

PowerCenter 资料

PowerCenter 资料