products

PowerCenter 8 分区选项

为处理大容量数据提供高性能

分区选项通过并行数据处理提高 PowerCenter 的性能,并有助于建立 PowerCenter 在行业中的性能优势。此选项提供了基于线程的体系结构和自动数据分区功能,自动数据分区功能优化了多处理器和基于网格的硬件环境中的并行处理


优势

进行高效且经济的扩展,以处理大容量数据

提高开发人员的生产能力
优化系统性能,以响应不断变化的业务需求


PowerCenter 分区选项的主要特性

  数据高性能并行化
自动使 PowerCenter 分区与数据库表分区保持一致,以改善系统性能
通过利用 PowerCenter 的并行引擎自动确保数据完整性,该引擎动态调整数据分区以实现集合导向型转换
  会话设计工具

允许快速、便捷地创建用户定义的分区设定

允许使用分区图确定最佳分区点
收集可配置的会话选项(如差错处理、恢复策略、内存分配和事件记录)的统计数据,最大限度地提高性能
  集成的监视控制台
收集会话统计数据(如吞吐量、行/秒、错误详细信息和性能优化)以识别潜在的瓶颈和未来趋势
显示所有会话执行和相关性详细信息
  多分区设定
通过多种机制(包括键范围分区、基于哈希算法的分区、轮询分区或文件分区)支持并行化
通过并行处理数据转换管线中的特定分区来支持并行化,从而最大限度地提高数据吞吐量


您的企业为什么需要 PowerCenter 分区选项?

  高效且经济地扩展
利用分区选项,您可以通过将数据处理任务划分成多个子任务来执行最佳的并行会话。这些子任务以并行的方式运行,分散在多处理器系统中的可用 CPU 中。当不同的处理器共享计算负载时,系统能以更快的速度处理大容量数据。当为关系数据库提供数据或存储数据库中的数据时,分区选项允许 PowerCenter 自动使其分区与数据库表分区保持一致,以便改善系统的性能。不同于需要手动数据分区的方法,由于 PowerCenter 的并行引擎动态调整数据分区以实现集合导向型转换(如汇集器或分类器),因此,系统可以自动确保数据的一致性。
  提高开发人员的生产能力
分区选项提供了直观、基于 GUI 的会话设计工具,这些工具减少了开发人员在最初和当前进行的配置和性能调整任务上花费的时间。用户定义的分区设定易于创建。另外,分区图也能帮助开发人员确定最佳分区点。可配置的会话选项(如差错处理、恢复策略、内存分配和事件记录)使得收集统计数据(用于性能最大化)的工作简单易行。
  优化性能以响应不断变化的业务需求
分区选项允许开发人员轻松地收集全面的会话统计数据(如吞吐量、行/秒、错误详细信息和性能优化)。这些统计数据有助于识别潜在的瓶颈和未来趋势。同时,集成的监视控制台允许用户查看所有会话执行和相关性的详细信息。利用 PowerCenter 的元数据驱动的体系结构,系统从物理执行方案中抽取数据转换逻辑。因此,无需危及最初数据映射的逻辑和设计,用户就可以实现快速的性能调整。面对不断增加的数据量和不断改变的业务需求,开发人员能够以简单的方式不断优化系统性能。