Tutorial de integración de datos: Observar datos
Siga este tutorial para observar el estado de las tareas de DataStage. Tu objetivo es:
- Cree una alerta de métrica del sistema para observar métricas específicas y recibir notificaciones cuando se superen los umbrales.
- Crea un receptor de alertas de Slack para recibir notificaciones directamente en el canal de Slack que elijas.
- Investigue la alerta y solucione el error.
- Plataformas en la nube
Antes de empezar, asegúrese de haber completado el tutorial Transformar datos por lotes con DataStage.
La historia de la guía de aprendizaje es que Golden Bank necesita cumplir con un nuevo reglamento por el que no puede realizar préstamos a los solicitantes de préstamos que no estén cualificados. Dado que la información sobre los solicitantes debe recopilarse de diversas fuentes, es necesario integrar toda la información en una única hoja de cálculo. La hoja de cálculo debe incluir información sobre la puntuación crediticia de cada solicitante, la deuda total del solicitante y una tabla de consulta de tipos de interés. Por último, querrás cargar tus datos en un archivo de salida de destino CSV. Durante el proceso, es importante detectar cualquier problema con los datos.
Golden Bank necesita asegurarse de que todas estas tareas de integración se realizan con éxito. Para asegurarse de que detectan cualquier error y pueden resolverlo antes de que tenga un gran impacto en sus datos, el equipo de ingeniería de datos configuró una alerta de métricas del sistema para las rows written métricas. Al configurar esta alerta, se les notifica si hay alguna discrepancia en la operación Lookup_1 > Link_10 > Sequential_file_1 entre las ejecuciones de los trabajos. Como resultado, el equipo de ingeniería de datos puede investigar y solucionar rápidamente el problema subyacente, en lugar de estar constantemente pendiente de los errores y comparando los datos.
Vista previa de la guía de aprendizaje
En esta guía de aprendizaje, realizará estas tareas:
- Establecer los requisitos previos
- Tarea 1: Crear una alerta de métrica del sistema que se active cuando la discrepancia en el número de filas escritas en la operación Lookup_1 > Link_10 > Sequential_file_1 supere el porcentaje de desviación permitido.
- Tarea 2: Crear y asignar un receptor de alertas de Slack para recibir la alerta en tu canal de Slack.
- Tarea 3: Ejecutar la tarea DataStage
- Tarea 4: Investigar la alerta y solucionar el problema
- Tarea 5: Marcar la alerta como Resuelta.
Consejos para completar este tutorial
Aquí tienes algunos consejos para completar con éxito este tutorial.
Configurar las ventanas del navegador
Para obtener una experiencia óptima al completar este tutorial, abra su cuenta en una ventana del navegador y mantenga esta página del tutorial abierta en otra ventana del navegador para poder cambiar fácilmente entre las dos ventanas. Considere la posibilidad de colocar las dos ventanas del navegador una al lado de la otra para facilitar el seguimiento.

Establecer los requisitos previos
Regístrese en IBM watsonx.data integración
Debe registrarse en IBM watsonx.data integración para observar sus datos. Si aún no tienes una cuenta, regístrate para integrarte en IBM watsonx.data.
Funciones y permisos necesarios
Para crear y gestionar alertas, necesita el permiso Gestionar alerta. Se concede automáticamente cuando eres Administrador o Editor de un proyecto (en el proyecto tienes los activos que quieres observar).
Para crear y gestionar receptores de alertas, necesita el permiso Gestionar receptor. Se concede automáticamente.
Requisitos previos de Slack
Para crear un receptor de alertas de Slack, debes tener una cuenta en Slack, una aplicación API de Slack y un webhook entrante de Slack. Tu aplicación API de Slack debe estar conectada al espacio de trabajo de Slack que contiene el canal o la conversación en la que deseas recibir alertas. Para obtener más información, consulte Creación de un receptor de alertas de Slack.
Completa el tutorial DataStage y modifica sus datos
Para supervisar los datos de DataStage, primero debe crear un flujo de DataStage siguiendo las instrucciones del tutorial de integración de datos: Transformar datos por lotes con DataStage. Para nuestro ejemplo actual, podemos crear una alerta que se active automáticamente cuando haya una discrepancia en la operación Lookup_1 > Link_10 > Sequential_file_1 entre las ejecuciones del trabajo. Utilizaremos nuestro flujo de ejemplo existente « DataStage » y cambiaremos el código de estado en la etapa «Filter State Code ». Para crear este error, abra el proyecto que se creó durante el tutorial de integración de datos: Transformar datos por lotes con DataStage y siga los pasos:
Abre el flujo que creaste en el tutorial y comprueba el número de filas en Link 10. Debería ascender a 41. Si el número no aparece, compile y ejecute su trabajo.
Haga doble clic en la etapa «Filtrar código de estado ».
Haga clic en Editar > Cláusula WHERE.
Cambie la cláusula «Where» = «CA» por la cláusula «Where» = «CO».
Pulse Aplicar y volver.
Pulse Guardar.
Guarde, compile y ejecute el trabajo. El trabajo se ha completado correctamente porque la modificación del valor en el
WHERE clauseno constituye un error lógico.

Tarea 1: Crear una alerta de métrica del sistema que se active cuando la discrepancia en el número de filas escritas en la operación Lookup_1 > Link_10 > Sequential_file_1 supere el porcentaje de desviación permitido
Modificar el valor en el WHERE clause puede dar lugar a que se genere un número incorrecto de filas en el archivo de destino. Este problema podría pasar desapercibido hasta mucho más adelante en el proceso, lo que podría dar lugar a la propagación de datos inexactos en fases posteriores. Para asegurarse de que el problema se detecte en una fase temprana del proceso, puede configurar una alerta de métricas del sistema. Con esta alerta, puede observar si hay alguna discrepancia en la operación especificada entre las ejecuciones de los trabajos. Antes de la modificación de la etapa del código de estado del filtro, el número de rows written era 41. Es nuestro valor de referencia. Queremos que la alerta se active cuando el número de rows written sea inferior o superior al 30 % del valor de referencia. Siga estos pasos para crear una alerta de métrica del sistema para el trabajo « DataStage » (Comprobación de la integridad de los archivos de sistema):
En el menú de navegación,
selecciona «Datos» > « Data Observability ».
Haz clic en «Copiar al portapapeles» para copiarlo.Ve a la Data Observability página y haz clic en Nueva alerta.
Especifique su tipo: Métrica del sistema y haga clic en Siguiente.
Para seleccionar el trabajo de « DataStage » (Comprobación de la integridad de los activos) para el que desea crear la alerta, haga clic en «Select assets» (Seleccionar activos).
Seleccione el espacio de trabajo en el que se creó el trabajo (en este tutorial, el nombre del espacio de trabajo es « Data Observability tutorial », aunque es posible que su trabajo tenga un nombre diferente).
Seleccione el trabajo (en este tutorial, el nombre del trabajo es «Data Integration.DataStage », aunque es posible que el suyo tenga un nombre diferente).
Haga clic en Añadir activos.
En la sección Métrica, seleccione la métrica que desea observar. Para este escenario: Lookup_1 > Link_10 > Sequential_file_1 (Filas escritas)
Pulse Siguiente.
Configure la condición. Debe decidir el tipo de umbral: valor fijo o desviación porcentual. Si selecciona un valor fijo, la alerta se activa cuando hay una discrepancia entre la métrica seleccionada en el conjunto de datos entre las ejecuciones. En cuanto a la desviación porcentual, el sistema permite cierta discrepancia en las métricas (definida por el usuario). La alerta se activa si el valor de la métrica es superior o inferior al valor de desviación porcentual definido. Para este escenario:
Seleccione Desviación porcentual.
Establezca el valor de referencia en 41 (el número de filas de nuestro conjunto de datos de origen).
Establezca la desviación porcentual en 30, que es un rango aceptable para este caso de uso.
Cuando se establecen estos valores, el gráfico muestra el rango de valores aceptables para los que no se activará la alerta. En este caso, la alerta no se activará para valores superiores a 54 o inferiores a 28. Los valores proporcionados son el resultado del siguiente cálculo: 30 % de 41 = 12,3 41-12,3 = 28,7 41+12,3 = 53,3 Cualquier valor inferior a 28 o superior a 54 activa una alerta.
Opcional : también puede seleccionar el número de ejecuciones para las que desea ver la tendencia de la tarea.
Pulse Siguiente.
Configure otros detalles, tales como:
- Gravedad, que se establece solo con fines informativos.
- Nombre, que debe ser único.
- Opcional : Descripción.
Pulse Siguiente
Como no hemos creado ningún receptor de alertas en este tutorial, haga clic en Crear para crear la alerta. Su alerta está lista. La próxima vez que ejecute su trabajo en DataStage,, se activará.

Comprueba tu progreso
Vaya a la pestaña Alertas definidas y compruebe si su alerta está ahí. Haz clic en la alerta para ver los detalles.
Tarea 2: Crear y asignar un receptor de alertas de Slack para recibir la alerta en tu canal de Slack
Puede configurar un receptor de alertas. Como resultado, ya no es necesario iniciar sesión para comprobar las alertas, ya que el sistema envía cada alerta activada directamente a la herramienta que usted elija. En Data Observability, siga estos pasos para crear un receptor de alertas de Slack :
Haga clic en Nuevo receptor de alertas.
Selecciona Slack y haz clic en Siguiente.
Proporcione toda la información requerida:
Pega el webhook de Slack URL que has obtenido de la interfaz de usuario de Slack.
El nombre del canal y de la conversación de Slack se proporcionan únicamente con fines informativos. Puede proporcionarlos con o sin #.
Cuando completes los datos necesarios, la conexión del webhook de Slack se activará. Pulse el botón. Si la conexión se establece correctamente, se envía un mensaje al canal o conversación de Slack proporcionado.
Pulse Siguiente.
Seleccione la alerta que creó en la Tarea 1 para asignar el receptor de la alerta.
Pulse Crear.
Se crea el receptor de alertas.

Comprueba tu progreso
El receptor de alertas aparece en la pestaña «Receptores de alertas».
Tarea 3: Ejecutar la tarea DataStage
Vuelva a su lienzo DataStage y ejecute el trabajo.

Comprueba tu progreso
El trabajo se ejecuta.
Tarea 4: Investigar la alerta y solucionar el problema
El sistema ejecuta la tarea « DataStage ». Recibirás al instante un mensaje en Slack con la alerta activada. Siga estos pasos para investigar la alerta:
Vaya a la pestaña Alertas activadas en la página Data Observability. Ya se muestra la alerta. Dado que un número diferente de
rows writtenno constituye un error, el sistema no muestra ningún mensaje de error ni registros de errores.Opcional : Para informar a otros usuarios de que se está trabajando en la alerta, seleccione la alerta y haga clic en Reconocer.
Haga clic en Detalles de ejecución del trabajo para acceder a los registros del trabajo, las métricas de ejecución y los parámetros.
En la sección Detalles de la ejecución, haga clic en el flujo asociado para mostrar el flujo del trabajo. El número de filas para el enlace 10 (entre la etapa de búsqueda 1 y la etapa secuencial 1) es igual a 9, lo que está por debajo del porcentaje de desviación permitido.
En el flujo, busca la etapa «Código de estado del filtro» y haz doble clic en ella.
Pulse Editar.
Cambiar la cláusula «Where» = CO por la cláusula «Where» = CA.
Pulse Aplicar y volver.
Pulse Guardar.
Compile y ejecute el trabajo.

Comprueba tu progreso
Al ejecutar el trabajo, aparece el siguiente mensaje: Run successful with warnings. Compruebe el número de filas en el enlace 10. Vuelve a ser 41. Significa que el número de rows written es correcto. No se activa ninguna alerta.
Significa que el problema está solucionado.
Tarea 5: Marcar la alerta como Resuelta
- Vuelve a la pestaña Alertas activadas y cambia el estado de la alerta a Resuelta.
Comprueba tu progreso
La alerta aparece en la pestaña «Alertas resueltas».
Como ingeniero de datos, creaste una alerta de métricas del sistema, un receptor de alertas, investigaste la alerta activada y solucionaste el problema.