Las mejores prácticas son una opción mejor que intentar predecir el futuro

John Schimidt

No puede adelantarse a las necesidades de datos futuras. Lo mejor que puede hacer es evitar pagar por los errores no corregidos actualmente.

Hoy en día, las organizaciones bregan con datos de una enorme variedad de fuentes a través de un número igualmente variado de interfaces. Para que esos datos tengan sentido, los departamentos de IT deben extraerlos, convertirlos a un formato utilizable y cargarlos en los sistemas de data warehousing adecuados. A menudo, los datos de una serie de aplicaciones se integran para informar a un único proceso de negocio.

No es una tarea sencilla. Resulta incluso más difícil por el hecho de que realizar un cambio en los datos de una ubicación afecta a los datos de otras ubicaciones.

El precio de los datos sucios

En la mayoría de las organizaciones, los proyectos de integración son reaccionarios. Se ponen en marcha sólo cuando existe una necesidad visible. Responder de forma rápida y eficaz a las solicitudes de las partes interesadas del negocio puede verse como un imperativo. Pero si realiza proyectos de integración de un modo ad hoc, corre el riesgo de aumentar las interfaces punto a punto que no encajan en las necesidades de mayor gestión de datos de su empresa.

Las consecuencias de las implantaciones individuales son grandes:

  1. Estas tareas no se pueden replicar, por lo que el coste de las mejoras y el soporte continuos será alto debido a la complejidad inherente del proyecto.
  2. El linaje de los datos no se puede garantizar, así que se arriesga a crear procesos incoherentes con las reglas de negocio existentes que rigen la transformación y la calidad de los datos.
  3. Estos sistemas individuales serán difíciles de adaptar y actualizar porque cada uno necesitará una atención especial debido a la existencia de reglas exclusivas, código personalizado y datos incoherentes.

Inversión de datos limpios

Al poner en marcha proyectos de integración de datos, no puede predecir el futuro. Aunque con frecuencia el área de negocio es capaz de predecir correctamente las necesidades, también carece de perspectiva. Lo mejor que puede hacer es seguir las mejores prácticas para acabar con las dependencias de interfaz de punto, como las siguientes:

  1. Desvincular las aplicaciones para reducir las dependencias.
  2. Implementar estándares de integración de datos para permitir intercambios de información entre sistemas.
  3. Utilizar el almacenamiento temporal para facilitar el consumo de grandes conjuntos de datos a diferentes latencias.
  4. Conservar registros de los cambios que realiza en los datos a fin de proporcionar una visibilidad total de los datos, así como de los metadatos.

Es posible que piense que no puede destinar tiempo o recursos a estos pasos. También puede carecer de un compromiso firme de los usuarios de asumir el trabajo necesario para conservar la fidelidad de los datos. Sin embargo, sus problemas sólo se agravarán mientras se resista a una solución de gestión de datos centralizada.

Si estos desafíos parecen insalvables, puede que desee plantearse una solución que automatiza muchos de estos procesos, si no todos. Para obtener más información, consulte The Next-Generation of Data Integration: Transforming Data Chaos into Breakthrough Results, que proporciona recomendaciones sobre cómo eliminar los compromisos derivados de los enfoques tradicionales de la integración de datos.

Referencias

  • 1 The Data Warehousing Institute, “2012 BI Benchmark Report” y “2008 BI Benchmark Report.”

John Schmidt

agosto 2013

Para arquitectos

Sus problemas sólo se agravarán mientras se resista a una solución de gestión de datos centralizada."