最佳实践胜过试图预测未来

John Schimidt

您无法预料明天的数据需求。您能做就是避免为今日的错误买单。

今天让企业陷入纠缠的数据来自种类繁多的数据源,它们经过的接口也同样繁杂。要使这些数据有意义,IT 部门就必须提取、将其转换为可用格式,并载入到正确的数据仓库系统。来自多个应用程序的数据通常被集成在一起,形成单个业务流程。

这绝非易事。使它更具挑战性的事实在于,数据的一处更改可能会牵一发而动全身。

为脏数据付出代价

在多数企业中,集成项目是被动应付型的。只有在有很明显的需要时才会开展。快速高效响应业务相关方的请求看来势在必行。但如果您以临时方式执行集成项目,您就会冒险增加了不适合企业大数据管理需要的点对点接口。

个别部署的后果是巨大的:

  1. 任务不可复制,因而持续支持及改进的成本将会因项目内在复杂性而变高。
  2. 数据沿袭无法得到保证,因而您冒着创建与现有治理数据变化和质量业务规则不一致的流程的风险。
  3. 个体系统的调整和更新将会困难,因为每个都由于独特规则、客户代码和不一致数据而需要特别注意。

投资干净数据

开始数据集成项目时您无法预测未来。在业务部门方面,往往自信地预测需求,但同样缺乏洞察力。最好的做法是遵循最佳实践,以打破点接口依赖。如下所述:

  1. 减少应用程序,以降低依赖。
  2. 实现系统间信息交换的数据和集成标准。
  3. 使用分段以优化各种延迟下大数据集的消耗。
  4. 维护数据修改记录,以提供数据及原数据的端到端可视性。

您可能觉得您没有这样的时间或资源投入到这些步骤中。您可能也缺乏利益相关者关于展开必要工作以保持数据高保真的坚定承诺。然而,抵制集中数据管理解决方案越久,您的问题就会越显著。

如果这些挑战看似无法逾越,您可能会考虑一个即使不能全部但至少自动化其中大部分流程的解决方案。了解更多,参阅 新一代数据集成:把数据混乱转化为突破性成果,该白皮书提供关于消除来源自统数据集成方法的妥协的建议。

文章资源

  • 1 数据仓库学院,“2012 BI Benchmark Report”(《2012 年商业智能基准报告》)和“2008 BI Benchmark Report”(《2008 年商业智能基准报告》)。
抵制集中数据管理解决方案越久,您的问题就会越显著。"