Nodo Anonimizar

En Synthetic Data Generator, puede utilizar el nodo Anonimizar para enmascarar datos sensibles sustituyéndolos por un conjunto de datos artificial, aunque realista.

Descripción
El nodo Anonymize de un flujo Synthetic Data Generator protege la información sensible del conjunto de datos sustituyéndola por datos artificiales. Los datos artificiales parecen lo bastante realistas como para utilizarlos en lugar de los datos reales. Esto ayuda a mantener la privacidad al tiempo que se preserva la utilidad del conjunto de datos para generar datos sintéticos.
Utilización del nodo
El nodo Anonymize suele ir después del nodo Import en el flujo Synthetic Data Generator. Toma los datos de origen y anonimiza las columnas seleccionadas. A continuación, los valores anonimizados se utilizan para todos los nodos posteriores en lugar de los datos reales.
Sólo necesita un nodo Anonymize en su flujo Synthetic Data Generator para enmascarar los datos de origen. Puede seleccionar cualquiera de las columnas disponibles en un nodo.
Obligatorio u opcional
El nodo Anonimizar es opcional, pero es muy recomendable cuando se trata de datos sensibles para garantizar el cumplimiento de la privacidad. Este nodo puede ser necesario si tiene previsto compartir o utilizar el conjunto de datos fuera de entornos controlados y necesita proteger la privacidad individual.

Scripting con el nodo Anonymize

Puede utilizar lenguajes de scripting, como Python, para establecer progamáticamente las propiedades de los nodos.

Anonimizar las propiedades del nodo

Las siguientes propiedades son específicas del nodo Anonymize. Para obtener información sobre las propiedades comunes de los nodos, consulte Propiedades de flujos y nodos.

Todas las propiedades de nodo en un nodo Anonymize son propiedades estructuradas además de sus otros tipos de datos.

Tabla 1. Propiedades de los nodos para la programación
Nombre de propiedad Tipo de datos Descripción de la propiedad
enable_anonymize Distintivo Seleccione True para activar la anonimización de los valores de campo (equivalente a seleccionar para ese campo en la columna Anonimizar valores ).
use_prefix Distintivo Establézcalo en True para utilizar un prefijo personalizado que usted especifique. Se aplica a los campos que serán anonimizados por el método Hash. Equivale a elegir la opción Personalizado en la configuración de Reemplazar valores para ese campo.
prefix Serie El prefijo personalizado que desea utilizar. Equivale a escribir un prefijo en el cuadro de texto de la configuración de Reemplazar valores. El prefijo predeterminado es el valor por defecto si no se ha especificado nada más.
transformation Aleatorio, Fijo Determina si los parámetros de transformación de un campo anonimizado mediante el método Transform serán aleatorios o fijos.
set_random_seed Distintivo Cuando se establece en True, se utilizará el valor de semilla especificado si transformation también se establece en Random.
random_seed Entero Cuando set_random_seed se establece en True, este valor sirve de semilla para el número aleatorio.
scale Número Cuando transformation se establece en Fixed, este valor se utiliza para la «escala por» El valor máximo de escala es normalmente 10, pero puede reducirlo para evitar el desbordamiento.
translate Número Cuando transformation se establece en Fixed, este valor se utiliza para «translate» El valor máximo de traducción es normalmente 1000, pero puedes reducirlo para evitar el desbordamiento.

Ejemplo

A continuación se muestra un ejemplo de las propiedades utilizadas en un scriipt.

stream = sdg.script.stream()
typenode = stream.findByID("id42KW3MSA94B")

node = stream.createAt("anonymize", "My node", 192, 96)
stream.link(typenode, node)

# Anonymize node requires the input fields while setting the values
node.setKeyedPropertyValue("enable_anonymize", "Age", True)
node.setKeyedPropertyValue("transformation", "Age", "Random")
node.setKeyedPropertyValue("set_random_seed", "Age", True)
node.setKeyedPropertyValue("random_seed", "Age", 123)
node.setKeyedPropertyValue("enable_anonymize", "Drug", True)
node.setKeyedPropertyValue("use_prefix", "Drug", True)
node.setKeyedPropertyValue("prefix", "Drug", "myprefix")