Nodo Anonimizar
En Synthetic Data Generator, puede utilizar el nodo Anonimizar para enmascarar datos sensibles sustituyéndolos por un conjunto de datos artificial, aunque realista.
- Descripción
- El nodo Anonymize de un flujo Synthetic Data Generator protege la información sensible del conjunto de datos sustituyéndola por datos artificiales. Los datos artificiales parecen lo bastante realistas como para utilizarlos en lugar de los datos reales. Esto ayuda a mantener la privacidad al tiempo que se preserva la utilidad del conjunto de datos para generar datos sintéticos.
- Utilización del nodo
- El nodo Anonymize suele ir después del nodo Import en el flujo Synthetic Data Generator. Toma los datos de origen y anonimiza las columnas seleccionadas. A continuación, los valores anonimizados se utilizan para todos los nodos posteriores en lugar de los datos reales.
- Sólo necesita un nodo Anonymize en su flujo Synthetic Data Generator para enmascarar los datos de origen. Puede seleccionar cualquiera de las columnas disponibles en un nodo.
- Obligatorio u opcional
- El nodo Anonimizar es opcional, pero es muy recomendable cuando se trata de datos sensibles para garantizar el cumplimiento de la privacidad. Este nodo puede ser necesario si tiene previsto compartir o utilizar el conjunto de datos fuera de entornos controlados y necesita proteger la privacidad individual.
Scripting con el nodo Anonymize
Puede utilizar lenguajes de scripting, como Python, para establecer progamáticamente las propiedades de los nodos.
Anonimizar las propiedades del nodo
Las siguientes propiedades son específicas del nodo Anonymize. Para obtener información sobre las propiedades comunes de los nodos, consulte Propiedades de flujos y nodos.
Todas las propiedades de nodo en un nodo Anonymize son propiedades estructuradas además de sus otros tipos de datos.
| Nombre de propiedad | Tipo de datos | Descripción de la propiedad |
|---|---|---|
enable_anonymize |
Distintivo | Seleccione True para activar la anonimización de los valores de campo (equivalente a seleccionar Sí para ese campo en la columna Anonimizar valores ). |
use_prefix |
Distintivo | Establézcalo en True para utilizar un prefijo personalizado que usted especifique. Se aplica a los campos que serán anonimizados por el método Hash. Equivale a elegir la opción Personalizado en la configuración de Reemplazar valores para ese campo. |
prefix |
Serie | El prefijo personalizado que desea utilizar. Equivale a escribir un prefijo en el cuadro de texto de la configuración de Reemplazar valores. El prefijo predeterminado es el valor por defecto si no se ha especificado nada más. |
transformation |
Aleatorio, Fijo | Determina si los parámetros de transformación de un campo anonimizado mediante el método Transform serán aleatorios o fijos. |
set_random_seed |
Distintivo | Cuando se establece en True, se utilizará el valor de semilla especificado si transformation también se establece en Random. |
random_seed |
Entero | Cuando set_random_seed se establece en True, este valor sirve de semilla para el número aleatorio. |
scale |
Número | Cuando transformation se establece en Fixed, este valor se utiliza para la «escala por» El valor máximo de escala es normalmente 10, pero puede reducirlo para evitar el desbordamiento. |
translate |
Número | Cuando transformation se establece en Fixed, este valor se utiliza para «translate» El valor máximo de traducción es normalmente 1000, pero puedes reducirlo para evitar el desbordamiento. |
Ejemplo
A continuación se muestra un ejemplo de las propiedades utilizadas en un scriipt.
stream = sdg.script.stream()
typenode = stream.findByID("id42KW3MSA94B")
node = stream.createAt("anonymize", "My node", 192, 96)
stream.link(typenode, node)
# Anonymize node requires the input fields while setting the values
node.setKeyedPropertyValue("enable_anonymize", "Age", True)
node.setKeyedPropertyValue("transformation", "Age", "Random")
node.setKeyedPropertyValue("set_random_seed", "Age", True)
node.setKeyedPropertyValue("random_seed", "Age", 123)
node.setKeyedPropertyValue("enable_anonymize", "Drug", True)
node.setKeyedPropertyValue("use_prefix", "Drug", True)
node.setKeyedPropertyValue("prefix", "Drug", "myprefix")