jueves, 14 de abril de 2011

Data Quality Management como propedeútica para la implementación de una solución eficaz de Business Intelligent

En momentos en que el Business Intelligent (B.I.) forma parte de nuestra vida corporativa habitual, sigue quedando marginada una cuestión previa, pero que está en la base de cualquier solución de Inteligencia de Negocio que queramos implementar. Sobre todo si queremos que ésta sea verdaderamente eficaz: Estoy hablando de Data Quality Management (DQM). Podemos haber implantado la mejor y más completa solución de Business Intelligent, el mejor diseño de Datawarehouse pero si la calidad de nuestros datos es mala toda esa inversión no nos ofrecerá ni el ROI ni los resultados que esperamos. 

El Data Quality Management consiste en el establecimiento de directrices, responsabilidades,  y procedimientos concernientes a la adquisición, el mantenimiento, la difusión y la disposición de los datos. La calidad de los datos que se encuentran en una base de datos que se ha desarrollado sin un adecuado esquema de gestión de datos pueden no ser adecuados para definir las necesidades reales, actuales o futuras de un negocio.
 
Por desgracia, la mayor parte de las empresas, grandes, medianas y pequeñas, aprenden la importancia de una correcta gestión de la calidad de sus datos a la tremenda. Sólo cuando es evidente que no hay una conexión entre los datos de los diferentes informes que los sistemas de Business Intelligent le ofrecen y la realidad financiera de su negocio. Aproximadamente entre un 8% y un 10% de los datos de nuestras bases de datos son de mala calidad y nos están ofreciendo desviaciones importantes en los informes que obtenemos de nuestras soluciones de Business Intelligent.
 
¿Cuáles son las causas de la baja calidad de nuestros datos? Pues son muy variadas, pero citaré algunas de las que mi experiencia me ha mostrado como las más habituales:
  • Datos introducidos vía web por los propios clientes
  • Datos introducidos por los propios empleados de la empresa
  • Actualizaciones de la base de datos
  • Cargas Batch
  • Integración de sistemas
  • Cambios de domicilio, etc.
Es por ello muy importante aplicar un procedimiento correctivo que permita identificar, corregir y limpiar esas impurezas de nuestra base de datos como paso previo a la instalación de una solución de Business Intelligent. ¿Cuáles son los pasos que damos para llegar a tener una calidad de datos que nos permita obtener informes adecuados que hagan posible una toma acertada de decisiones?

Básicamente, el proceso se divide en 3 momentos fundamentales. Dentro de cada uno de esos momentos se realizan tareas diferentes. Pero eso será materia de otro post, esos momentos son:
  • Data Profiling
  • Data Cleansing
  • Data Auditing

En cada una de esas fases, con la ayuda de diferentes herramientas, se realizan estadísticas, perfiles, y se toman decisiones sobre que hacer con la casuística descubierta. Se deduplican los datos repetidos y se enriquecen los archivos incompletos. Se establecen políticas para la gestión futura de los datos y se determinan posibles usos para datos que no estaban siendo tenidos en cuenta.

Como se puede ver, las posibilidades que ofrece a la toma de decisiones son demasiado importantes como para desdeñarlas. Y las ventajas que ofrece son superiores a los costes de realizar una limpieza previa a la implementación de cualquier solución de B.I. Por otro lado esta limpieza se puede realizar aunque ya tenga instalada su solución de B.I La cuestión nuclear es si queremos tomar decisiones de calidad tenemos que basarlas en datos de calidad.