IM InfoSphere Identity Insight, Versión 8.1

Gestión de calidad de datos (DQM)

La Gestión de calidad de datos (DQM) es el proceso de interconexión que comprueba que los datos tengan los valores necesarios, tipos de datos válidos y códigos válidos. También puede configurar DQM de modo que corrija los datos proporcionando valores por omisión, formateando números y fechas y añadiendo nuevos códigos.

La Gestión de calidad de datos, junto con higiene y estandarización de nombres e higiene y estandarización de direcciones, está diseñada para optimizar y mejorar la calidad de los datos. Esta preparación de la calidad de los datos constituye un paso esencial en la resolución de entidades, porque aumenta la fiabilidad de las entidades resueltas resultantes y las relaciones detectadas.

Para aplicar la gestión de calidad de datos a los datos cargados en el sistema, debe configurar reglas de gestión de calidad de datos (o reglas DQM). Las reglas DQM pueden realizar varias funciones de reparación, limpieza y estandarización sobre valores de datos de entidades de entrada, como formatear correctamente los números, identificar y corregir errores clericales y de transposición e identificar y corregir imprecisiones intencionadas incorporadas por alguien que intente ocultar sus identidades.

El producto viene preconfigurado con varias reglas SQM por segmento UMF que manejan los problemas más típicos de calidad de datos correspondientes a dicho segmento UMF. Pero puede configurar reglas DQM adicionales si las necesita. Sin embargo, antes de hacerlo debe estar familiarizado con la calidad de los datos original y con el proceso ETL (extracción, transformación y carga) utilizado para transformar los datos de identidades en UMF. Cuando sepa qué mejoras en los datos hay que realizar, puede seleccionar las reglas DQM, funciones y valores adecuados que aplicar a cada tipo de datos de identidades que necesitan una optimización de la calidad de los datos.

Ejemplo de utilización de una regla DQM

Por ejemplo, el formato de fecha del sistema es DD/MM/AAAA. Pero en varios de sus orígenes de datos, los valores de fecha están formateados como MM-DD-AAAA. Puede añadir la regla DQM 204 al segmento UMF <NUMBER>, configurándolo de modo que arregle todas las fechas de entrada formateadas como MM-DD-AAAA por el formato de fecha DD/MM/AAAA.



Comentarios

Última actualización: 2011