Generación de datos sintéticos estructurados
Synthetic Data Generator es una potente herramienta diseñada para generar datos que imitan los del mundo real. Las organizaciones pueden utilizar datos sintéticos para proteger la información confidencial y, al mismo tiempo, permitir la realización de pruebas, desarrollos y análisis sólidos. Synthetic Data Generator le ayuda a satisfacer sus necesidades en materia de protección de datos y cumplimiento de la normativa.
Puede utilizar sus datos existentes para crear datos sintéticos estructurados utilizando Synthetic Data Generator. Synthetic Data Generator genera datos sintéticos que imitan las características y relaciones que tienen los datos reales.
- Plataformas en la nube
- Formato de los datos
- Tabular: Tablas en archivos de datos como.xls,.csv o.json
- Más información sobre fuentes de datos en Synthetic Data Generator.
- Tamaño de datos
- El Synthetic Data Generator entorno puede importar hasta ~2.5GB de datos.
¿Qué es Synthetic Data Generator?
Synthetic Data Generator es una herramienta gráfica de edición de flujos. Puede construir flujos Synthetic Data Generator para generar datos sintéticos estructurados utilizando la interfaz visual. No es necesario programar.
El editor gráfico de flujos Synthetic Data Generator. 
Dispone de las siguientes opciones para generar datos con Synthetic Data Generator :
- Utilice Synthetic Data Generator para enmascarar e imitar sus datos de producción y, a continuación, genere datos tabulares sintéticos basados en los datos de producción
- Utilice Synthetic Data Generator para definir un esquema de datos personalizado y, a continuación, genere datos sintéticos basados en sus requisitos
Flujos de construcción
En Synthetic Data Generator, se configuran flujos para importar datos semilla y generar datos sintéticos a partir de ellos. Un flujo es una serie de nodos que se conectan en el lienzo.
- flow
- Un flujo es un grupo de operaciones de tratamiento de datos que se conectan en secuencias. Los flujos representan el flujo de datos a través de cada operación. Los datos fluyen desde la fuente de datos a través de la secuencia de operaciones hasta el final. Los flujos suelen comenzar con un nodo que importa los datos iniciales y terminan con un nodo que exporta los datos sintéticos. Los flujos se crean añadiendo nodos al lienzo y conectándolos entre sí.
- Lienzo
- El lienzo es el área de trabajo principal en Synthetic Data Generator, y es donde construyes tus flujos.
- Nodos
- Un nodo es un conjunto modular y autónomo de operaciones. Los nodos son una forma gráfica de representar estas operaciones, y cada nodo tiene un icono único. Los nodos se enlazan en el lienzo en un flujo para un procesamiento más complejo y la generación de datos.
Scripts
Puede utilizar secuencias de comandos en Synthetic Data Generator para automatizar tareas que son muy repetitivas o que requieren mucho tiempo si se realizan manualmente. Los scripts pueden realizar los mismos tipos de acciones que los usuarios con un ratón o un teclado, y puede escribir scripts en Python o Python para Spark.