Enmascarar datos con normas de protección de datos ( IBM watsonx.data intelligence )
Para enmascarar datos, los datos deben ajustarse a estos requisitos:
- Los datos están estructurados. Los datos deben estar en tablas relacionales o archivos CSV, Avro, datos particionados o Parquet.
- Las cabeceras de columna solo contienen caracteres alfanuméricos (a-z, A-Z, 0-9). Las cabeceras de columna no pueden contener caracteres no soportados, como caracteres de varios bytes o caracteres especiales.
Cuando elige la acción de enmascaramiento, debe especificar los criterios de enmascaramiento y el método de enmascaramiento.
Criterios de enmascaramiento
El criterio de enmascaramiento identifica las columnas a enmascarar. Seleccione el tipo de propiedad de columna y especifique uno o más valores específicos de la propiedad, que se combinarán lógicamente con el operador OR .
| Tipo de propiedad de columna | Descripción | Valores específicos |
|---|---|---|
| Término empresarial | Término empresarial que se asigna a la columna. | Busque y seleccione uno o más términos empresariales publicados. |
| Clase de datos | La clase de datos que se asigna a la columna. | Busque y seleccione una o varias clases de datos publicadas. |
| Etiqueta | Etiqueta que se asigna a una columna del activo. | Especifique una o más etiquetas, separadas por comas. |
| Nombre de columna | Nombre de una columna. | Especifique uno o más nombres de columna, separados por comas. |
Por ejemplo, supongamos que elige la propiedad de columna de la clase de datos y los valores específicos de la licencia de conducir del estado de California y la licencia de conducir del estado de Nevada. A continuación, los valores se enmascaran en columnas que se asignan a la clase de datos de licencia de conducir del estado de California o licencia de conducir del estado de Nevada.
Visión general de los métodos de enmascaramiento
Las principales diferencias entre los métodos de enmascaramiento son cuánto de las características originales de los datos permanecen. Cuantas más características originales de los datos queden, más útiles, pero menos seguros, son los datos enmascarados. Cuando elija un método de enmascaramiento, tenga en cuenta estos factores:
Integridad de datos: Si desea repetir el mismo valor enmascarado para un valor original repetido para mantener la integridad referencial entre las tablas.
Formato de datos: Si se debe conservar el formato de los datos originales. La conservación del formato significa que las letras se sustituyen por letras con las mismas ayúsculas y minúsculas, los dígitos se sustituyen por dígitos y el número de caracteres es el mismo.
En la tabla siguiente se describe cómo afecta a estas características cada método de enmascaramiento.
| Método | Descripción | ¿Conserva la integridad? | ¿Conserva el formato de datos |
|---|---|---|---|
| Ocultar | De forma predeterminada, sustituye los valores por diez caracteres X. El método más seguro. Puedes personalizar el carácter de sustitución y el número de caracteres de sustitución. Para las columnas que tienen algunas clases de datos asignadas, puede elegir la sustitución parcial. |
Nee | No: Si no está utilizando opciones avanzadas de enmascaramiento. Sí: Si está utilizando opciones avanzadas de enmascaramiento. |
| Sustituir | Sustituir los valores por valores generados aleatoriamente que conservan la integridad referencial. | Sí | Nee |
| Enmascarar | Sustituir valores por valores que conservan la integridad referencial y el formato de datos original. El método menos seguro. | Sí | Sí |
Ocultar
Puede redactar datos utilizando dos métodos diferentes.
El método de redacción básico sustituye cada valor de datos por una serie de exactamente diez letras de X. Con los datos ocultos, el formato de los datos y la integridad de los datos no se conservan. Ocultar es el método de enmascaramiento más seguro, pero da lugar a los datos enmascarados menos útiles.
Por ejemplo, el número de teléfono 510-555-1234 se sustituye por XXXXXXXXXX. Todos los demás números de teléfono se sustituyen por el mismo valor.
Sustituir
El método Sustituir sustituye los datos por valores que no coinciden con el formato original. Sin embargo, conserva la integridad referencial para los valores repetidos para todos los activos del catálogo. Los valores sustituidos no tienen sentido y el formato original de los valores no se puede determinar. El método Sustituir proporciona un nivel de seguridad y de utilidad de datos que está entre los métodos Ocultar y Oscurecer.
Por ejemplo, el número de teléfono 510-555-1234 siempre se sustituye por 500ddcc98133703531re3456.
Enmascarar
El método Oscurecer sustituye los valores de datos por valores con formato similar que coinciden con el formato original y conserva la integridad referencial para los valores repetidos. Puesto que los valores oscurecidos tienen un formato similar, pueden ser valores válidos. Oscurecer es el método de enmascaramiento menos seguro, pero da lugar a los datos enmascarados más útiles.
Por ejemplo, el número de teléfono 510-555-1234 siempre se sustituye por 415-987-6543.
Sin embargo, el método Oscurecer se limita a los valores de datos en columnas que tienen asignadas clases de datos con los siguientes tipos de información:
- Información personal, por ejemplo, atributos básicos de un individuo, como por ejemplo el sufijo honorífico de de nombre.
- Detalles del contacto, por ejemplo, direcciones de correo electrónico, números de teléfono, estado, distrito postal, latitud o longitud.
- Cuentas financieras, por ejemplo números de tarjetas de crédito, de cuentas bancarias o de otras cuentas financieras.
- Identidades de gobierno, por ejemplo, números de identificación personal emitidos por los gobiernos, como SSN (los números de seguridad social de EE.UU.) y CCN (los números de tarjetas de crédito).
- Información demográfica personal, por ejemplo, religión, origen étnico, estado civil, aficiones o estado de empleo.
- Datos de conectividad, por ejemplo, dirección IP o dirección mac.
Si crea una regla para oscurecer datos y la regla se aplica a los datos que no tienen asignada una clase de datos que da soporte al oscurecimiento, en su lugar se utiliza el método sustituto.
Visualice este vídeo para ver cómo se enmascaran los datos.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.