Cuando se pregunta a los profesionales que trabajan con Datos de muchas compañías sobre los principales problemas a los que se enfrentan en su día a día mencionan habitualmente problemas de Calidad de Datos. También indican como problema la cantidad de tiempo que deben dedicar a obtener, preparar y entender los datos que necesitan para hacer su lo que realmente es su trabajo.
Profundizando en el tipo de problemas de Calidad de Datos a los que se enfrentan se suelen mencionar:
- Datos incompletos (missing fields) o con valores no esperados
- Inconsistencias en los datos, basadas en el incumplimiento de reglas establecidas por el propio equipo
- Descuadres en totales con fuentes de referencia, típicamente la contabilidad
- Incoherencias en detalle con fuentes de referencia, maestro de clientes, proveedores, componentes, …
- Codificaciones diferentes para el mismo concepto
- …
Lo habitual es atacar los problemas anteriores de forma individual en cada tratamiento, generando lógica de corrección de los datos (business rules) que permite que el proceso continúe. Las acciones más habituales suelen ser:
- Ignorar registros incorrectos
- Generar valores por defecto para los atributos no presentes
- Recodificar atributos
- Generar registros ficticios de cuadre
- …
En todos los casos se están alterando los datos, alejándolos de la realidad que representan. Adicionalmente, en muchas compañías esto se hace de forma local en cada equipo o departamento, de forma que los tratamientos pueden ser diferentes en cada caso, generando así diferentes versiones a partir de los mismos datos de origen.
Lo que tienen en común todos los casos anteriores es que se presentan ante los consumidores de datos como problemas concretos de Calidad de Datos, y lo son, aunque en realidad el problema principal es de falta de Gobierno del Dato. La falta de Calidad del Dato es un síntoma, no un diagnóstico.
Sin embargo, cuando se pregunta a los mismos profesionales sobre Gobierno del Dato en general lo perciben como una iniciativa bastante alejada de la problemática anterior. Algunas de las palabras que aparecen en sus respuestas: burocrática, de poca utilidad práctica, alejado de la realidad, defensivo para cumplir ante los reguladores, …
Desde el punto de vista de Gobierno del Dato los problemas de Calidad del Dato son una oportunidad. A través del trabajo específico sobre los problemas de Calidad del Dato se puede incorporar a la organización elementos operativos de Gobierno del Dato
Los elementos concretos en los que una iniciativa de Calidad de Datos puede ayudar a implantar procedimientos de Gobierno del Dato son los siguientes
Roles y responsabilidades sobre Datos: Data Owner
Antes de comenzar a lanzar controles, analizar resultados e implantar business rules para corregir los problemas encontrados podemos trabajar en la identificación de quién debe establecer el criterio a seguir para toda la organización: Data Owner.
Esa búsqueda se debe basar en la naturaleza de los datos, el concepto de negocio que representan: cliente, operaciones, productos, contratos, facturas, impagados, …
La identificación de un responsable funcional también ayuda a generar el diálogo dentro de la organización sobre los diferentes requisitos que diferentes consumidores tienen sobre el mismo concepto.
Glosario
Una vez identificado un Data Owner es importante que se registre en el Glosario, conjuntamente con el dominio/Dato del cual es propietario.
Los criterios indicados por el Data Owner (business rules), además de ser implantados en los procesos operativos, deben ser registrados en el Glosario de forma que pueden ser compartidos con toda la organización.
De esta forma se refuerza el rol del Data Owner y la utilidad del Glosario como elemento de coordinación y colaboración en la organización.
Arquitectura de Datos/Golden Source
La revisión de ciertas situaciones con la perspectiva del Data Owner puede llegar a la conclusión de que la fuente utilizada por el uso concreto no es correcta y que el uso se debe reapuntar a la Golden Source implantada en el marco de la Arquitectura de Datos de la compañía, si es que esta existe.
Algunas veces sucede que la visión de la existencia de Golden Source para un dato concreto no es conocido en toda la organización. Sin embargo, el Data Owner sí que es conocedor de esta situación.
De esta forma se consigue un doble beneficio:
- Se refuerza la utilidad de la Golden Source con un nuevo uso
- Se homogeneizan los tratamientos de la organización
Cooperación entre áreas
De forma general, todas las propuestas anteriores generan elementos de colaboración en la organización. Esa colaboración se produce a través de los elementos de Gobierno del Dato y es motivada por una necesidad de negocio (caso de uso).
La componente de motivación es importante, muchas iniciativas de Gobierno del Dato no tienen suficiente tracción justamente porque carecen de este elemento de aportación a negocio.
En resumen, la percepción generalizada de problemas de Calidad de Datos en una organización puede ser utilizada como palanca para incorporar en la misma elementos de Gobierno del Dato. Por supuesto, se debe trabajar para identificar las causas raíz de los problemas y resolverlas pero vale la pena hacerlo teniendo en cuenta el impulso a la iniciativa más general de Gobierno del Dato.
Los elementos concretos en los que se puede aprovechar el impulso sobre Calidad de Datos para avanzar en Gobierno del Dato son:
- Roles y responsabilidades: especialmente el Data Owner del elemento revisado.
- Glosario de Conceptos de negocio
- Arquitectura de Datos: ubicación de la Golden Source informaciones
- Potenciación de la cooperación entre Áreas