Utilización de una aplicación de movimiento de datos de terceros para gestionar datos
Introducción al movimiento de datos con IBM Data Cataloging.
Antes de empezar
- La aplicación de terceros debe estar registrada en IBM Data Cataloging.
- IBM La catalogación de datos debe escanear tanto las fuentes de datos de origen como las de destino antes del movimiento de datos.
- La aplicación debe estar configurada para acceder a los mismos orígenes de datos de origen y destino.
Acerca de esta tarea
Las capacidades de IBM Data Cataloging se pueden ampliar mediante aplicaciones; por ejemplo, se pueden utilizar aplicaciones de transferencia de datos para mover datos entre orígenes de datos, basándose en la información de IBM Data Cataloging. Las aplicaciones se registran en IBM Data Cataloging proporcionando detalles de las operaciones que soportan y los parámetros que necesitan para cumplir la operación.
La tabla siguiente lista las operaciones de movimiento de datos soportadas:
| Operación | Tipo de origen | Tipo de destino |
|---|---|---|
| MOVE | NFS S3 SOCQ SMB/CIFS |
NFS S3 SOCQ SMB/CIFS |
| COPIA | NFS S3 SOCQ SMB/CIFS |
NFS S3 SOCQ SMB/CIFS |
| NIVEL | NFS S3 SOCQ SMB/CIFS |
NFS S3 SOCQ SMB/CIFS |
Por ahora, no es posible que una aplicación registre nuevas operaciones más allá de los registros listados en la tabla Operaciones de movimiento de datos.
Puede crear políticas de movimiento de datos que identifiquen archivos y objetos que sean candidatos para operaciones de datos, utilizando aplicaciones de movimiento de datos registradas. El motor de políticas de catalogación de datos de IBM genera mensajes de solicitud de trabajo en formato JSON. Contiene un lote de archivos u objetos con la información de origen y destino, y cualquier opción adicional como, por ejemplo, conservar las indicaciones de fecha y hora del sistema de origen.
Los mensajes de solicitud de trabajo se colocan en un tema de salida Kafka . La aplicación de movimiento de datos lee los mensajes del tema y realiza la operación de movimiento de datos necesaria, y proporciona mensajes de respuesta en formato JSON en un tema de entrada Kafka .
IBM La catalogación de datos puede interactuar con aplicaciones de movimiento de datos de terceros para mover, copiar o jerarquizar datos entre fuentes de datos. Cree políticas de gestión de datos en IBM Data Cataloging, y especifique el conjunto de documentos a procesar mediante un filtro de políticas. El filtro de políticas puede basarse en los metadatos del sistema o en los metadatos personalizados de los documentos recopilados por IBM Data Cataloging.
La aplicación de terceros se registra en IBM Data Cataloging proporcionando las operaciones que soporta (mover, copiar o nivelar). Para cada operación, proporciona la lista de valores de parámetro que necesita para realizar la operación.
Al crear la política de gestión de datos en IBM Data Cataloging, el usuario define el filtro, los valores de los parámetros y cuándo debe ejecutarse la política. Cuando se ejecuta la política, IBM Data Cataloging envía la lista de archivos a la aplicación de movimiento de datos y cualquier parámetro adicional. La aplicación procesa los archivos y devuelve un resumen de estado a IBM Data Cataloging. El resumen se muestra al usuario.
- Durante la migración de datos, los archivos migrados deben conservar las etiquetas de catalogación de datos de IBM. Puede seguir un procedimiento manual para conservar las etiquetas. Para obtener más información, consulte Conservación de etiquetas durante el movimiento de datos.
Una aplicación de movimiento de datos de terceros puede registrar un esquema, definiendo los parámetros que necesita para el movimiento de datos. Debe establecer estos parámetros en la interfaz de usuario (UI) de la aplicación al crear la política. Los parámetros no válidos provocan un error al enviar una política.
Sin embargo, en pocos casos, debido a la complejidad del esquema, el error puede no apuntar a la ubicación precisa del problema o puede indicar que un parámetro válido no es válido. Por lo tanto, cuando se produce un error al enviar una política, y no está definido dónde está el problema, se recomienda que compruebe todos los parámetros de política.