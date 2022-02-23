Etiquetas
Cómo garantizar la calidad, el valor y la fiabilidad de los datos

La calidad de los datos posteriores depende directamente de la calidad de los datos en la primera milla. Desde el momento mismo de la ingestión, unos datos precisos y fiables garantizarán que los datos utilizados posteriormente para el análisis, la visualización y la ciencia de datos sean de gran valor.

Para una empresa, esto marca la diferencia entre obtener beneficio de los datos y que éstos pasen a un segundo plano a la hora de tomar decisiones. En esta entrada de blog, describimos la importancia de la calidad de los datos, cómo auditar y monitorizar sus datos, y cómo lograr que sus líderes, colegas y miembros de la junta directiva se sumen.

Temas tratados:

  • Observabilidad proactiva de los datos
  • Auditoría de datos para garantizar la calidad
  • ¿Calidad de los datos o valor de los datos?
  • Cómo acercarse al equipo directivo y a la junta
  • Cómo entrenar internamente
  • La maldición del "Otro"
  • Buenas prácticas para empezar: Garantizar la calidad de los datos en toda la empresa

Observabilidad proactiva de los datos

Gestionar los datos es como correr una maratón. Muchos factores determinan el resultado final, y es un proceso largo. Sin embargo, supongamos que un corredor tropieza y se lastima el tobillo en ese primer kilómetro. En ese caso, no completará con éxito el maratón. Del mismo modo, si los datos no se monitorizan desde el momento de su ingestión, el resto del pipeline se verá afectado negativamente.

¿Cómo podemos garantizar el gobierno de datos durante este primer kilómetro del viaje de los datos?

Los datos entran en el pipeline desde varias fuentes: API externas, retiradas de datos de proveedores externos, extracción de una base de datos y otras. La monitorización de los datos en los puntos de ingesta garantiza que los ingenieros de datos puedan obtener una observabilidad proactiva de los datos que llegan.

Esto les permite gestionar y corregir datos para asegurar que el proceso sea saludable y fiable desde el principio.

Al obtener una observabilidad proactiva de los pipelines de datos, los ingenieros de datos pueden:

  • Confíe en los datos
  • Identificar fácilmente los puntos de ruptura
  • Solucionar rápidamente los problemas antes de que lleguen al almacén o al panel de control

Auditoría de datos para la calidad

Los ingenieros de datos que quieran revisar su pipeline o auditar y monitorizar una fuente de datos externa pueden utilizar las siguientes preguntas durante su evaluación:

  1. ¿Cuál es el alcance de la cobertura?
  2. ¿Cómo se rastrean los datos?
  3. ¿Existe una referencia de datos maestros que incluya requisitos y metadatos?
  4. ¿Se define al cliente de la manera correcta?
  5. ¿Existe una jerarquía común?
  6. ¿Las taxonomías aprovechan los requisitos empresariales?
  7. ¿Están configuradas correctamente las geografías?
  8. ¿Hay duplicados?
  9. ¿Se buscaron los datos antes de crear nuevas entidades?
  10. ¿Los datos están estructurados para permitir integraciones e interoperabilidad fluidas?

Ahora que hemos visto cómo los ingenieros de datos pueden enfocar la calidad de los datos, veamos cómo conseguir el apoyo de otros stakeholders de la empresa.

¿Calidad de los datos o valor de los datos?

Los ingenieros de datos suelen hablar de la  calidad de los datos. Sin embargo, al cambiar la conversación hacia el valor de los datos, se podría alentar a otros stakeholders de las organizaciones a participar de manera más significativa en el proceso de datos. Esto es importante para obtener atención, recursos y asistencia continua.

Para ello, recomendamos hablar sobre cómo los datos se alinean con los objetivos empresariales. De lo contrario, los stakeholders externos podrían pensar que la conversación gira únicamente en torno a la limpieza de los datos.

Cuatro criterios para determinar el valor de los datos, para los ingenieros y la empresa:

  • Relevancia: ¿Los datos cumplen con el objetivo empresarial?
  • Cobertura: ¿Los datos cubren todo el mercado, lo que permite a la empresa ponerlos en práctica?
  • Estructura: ¿Están estructurados los datos para que la empresa pueda utilizarlos?
  • Precisión: ¿Los datos son completos y correctos?

Cómo abordar el nivel directivo y el consejo de administración

Al cambiar la conversación hacia el valor de los datos en lugar de su calidad, se puede animar al equipo directivo y a la junta a invertir más recursos en el pipeline de datos. Aquí le explicamos cómo acercarse a ellos:

  1. Comience con las razones por las que la gestión de datos es de importancia estratégica para su empresa. Muestre cómo los datos pueden ayudar a ejecutar las intenciones estratégicas.
  2. Explique cómo la gestión y el análisis de los datos pueden ayudar a la empresa a llegar a donde tiene que ir. Muestre cómo los datos pueden crecer, mejorar y proteger el negocio. Puede entrelazar los cuatro criterios anteriores para enfatizar sus puntos.
  3. Conecte los datos a departamentos específicos. Muestre cómo los datos pueden ayudar a mejorar la eficiencia operativa, aumentar las ventas y mitigar el riesgo. Ningún otro departamento puede afirmar ayudar a crecer, mejorar y proteger todos los departamentos en la misma medida que la ingeniería de datos.
  4. No se centre en el proceso ni en la tecnología; de lo contrario, su una audiencia será muy pequeña.

Cómo entrenar internamente

Además del liderazgo de la empresa, también es importante que la gente se sume a la empresa. Esto ayudará al análisis y la monitorización de los datos. Los ingenieros de datos a menudo necesitan que los empleados de la empresa participen en el esfuerzo continuo de mantener los datos. Por ejemplo, los vendedores deben rellenar varios campos de un CRM al añadir una nueva oportunidad.

Recomendamos invertir tiempo en la gestión de personas, como la formación y asegurarnos de que todos estén de acuerdo respecto a la importancia de la calidad de los datos. Por ejemplo, explicar cómo la identificación precisa de las discrepancias puede ayudar a descubrir una anomalía empresarial (en lugar de una anomalía en los datos, que podría ocurrir si las personas no actualizan los datos de forma coherente y exhaustiva).

La maldición del "Otro"

La auditoría del valor de los datos es crucial porque afecta directamente a la capacidad de tomar decisiones sobre ellos. Si necesita un ejemplo para convencer a los empleados de que participen en la gestión de datos, recuérdeles "la maldición del 'otro'".

Cuando unidades de negocio como marketing, producto y ventas monitorización los paneles de control y una gran parte aparece bajo el título "otros", no disponen de todos los datos que necesitan y su capacidad de toma de decisiones se ve mermada. Este es el resultado de la falta de gestión de datos y gobierno de datos.

Buenas prácticas para empezar: Garantizar la calidad de los datos en toda la empresa

¿Cómo pueden los ingenieros de datos convertir la calidad de los datos de una teoría abstracta en práctica? Reunamos todo lo que hemos cubierto en un plan que se puede ejecutar.

Paso 1: Auditar la situación de los datos

En primer lugar, evalúe qué dominios deben cubrirse y qué tan bien se están gestionando. Esto incluye tipos de datos como:

  • Datos de relaciones con clientes, proveedores, socios, clientes potenciales, ciudadanos, pacientes y clientes
  • Datos de marca de productos, servicios, ofertas, banners y más

Identifique los errores en las diferentes etapas del pipeline, empezando por la ingestión.

Paso 2: Mostrar el pipeline de datos

Presenta la situación de los datos a los distintos stakeholders. Muestre cómo se gestionan los datos desde el punto de entrada hasta el producto final. Luego, explique cómo el valor actual de los datos está influyendo en sus decisiones. Presente los puntos de error y sugiera formas de corregirlos.

Paso 3: Priorizar los problemas que hay que solucionar

Elabore un plan con prioridades para impulsar el cambio. Determine qué problemas solucionar primero. Incluya la identificación de las fuentes y cómo envían los datos, la gestión de datos y la formación de los empleados. Obtenga la aceptación del plan y proceda a ejecutarlo.

Conclusión

Garantizar la calidad de los datos es responsabilidad de los ingenieros de datos y de toda la organización. La monitorización de la calidad de los datos comienza en el origen. Sin embargo, al conseguir el apoyo de los empleados y la dirección, los ingenieros de datos pueden asegurarse de que obtendrán los recursos y la atención necesarios para supervisar y solucionar los problemas de datos a lo largo de todo el pipeline, y ayudar al crecimiento del negocio.

Más información sobre la plataforma de observabilidad de los datos de IBM Databand y cómo ayuda a detectar antes los incidentes de datos, resolverlos más rápido y ofrecer datos más fiables a la empresa.

 