Generación de datos sintéticos estructurados

Synthetic Data Generator es una potente herramienta diseñada para generar datos que imitan los del mundo real. Las organizaciones pueden utilizar datos sintéticos para proteger la información confidencial y, al mismo tiempo, permitir la realización de pruebas, desarrollos y análisis sólidos. Synthetic Data Generator le ayuda a satisfacer sus necesidades en materia de protección de datos y cumplimiento de la normativa.

Puede utilizar sus datos existentes para crear datos sintéticos estructurados utilizando Synthetic Data Generator. Synthetic Data Generator genera datos sintéticos que imitan las características y relaciones que tienen los datos reales.

Plataformas en la nube
Formato de los datos
Tabular: Tablas en archivos de datos como.xls,.csv o.json
Más información sobre fuentes de datos en Synthetic Data Generator.
Tamaño de datos
El Synthetic Data Generator entorno puede importar hasta ~2.5GB de datos.

¿Qué es Synthetic Data Generator?

Synthetic Data Generator es una herramienta gráfica de edición de flujos. Puede construir flujos Synthetic Data Generator para generar datos sintéticos estructurados utilizando la interfaz visual. No es necesario programar.

El editor gráfico de flujos Synthetic Data Generator. Synthetic Data Generator visión general

Dispone de las siguientes opciones para generar datos con Synthetic Data Generator :

  • Utilice Synthetic Data Generator para enmascarar e imitar sus datos de producción y, a continuación, genere datos tabulares sintéticos basados en los datos de producción
  • Utilice Synthetic Data Generator para definir un esquema de datos personalizado y, a continuación, genere datos sintéticos basados en sus requisitos

Flujos de construcción

En Synthetic Data Generator, se configuran flujos para importar datos semilla y generar datos sintéticos a partir de ellos. Un flujo es una serie de nodos que se conectan en el lienzo.

flow
Un flujo es un grupo de operaciones de tratamiento de datos que se conectan en secuencias. Los flujos representan el flujo de datos a través de cada operación. Los datos fluyen desde la fuente de datos a través de la secuencia de operaciones hasta el final. Los flujos suelen comenzar con un nodo que importa los datos iniciales y terminan con un nodo que exporta los datos sintéticos. Los flujos se crean añadiendo nodos al lienzo y conectándolos entre sí.
Lienzo
El lienzo es el área de trabajo principal en Synthetic Data Generator, y es donde construyes tus flujos.
Nodos
Un nodo es un conjunto modular y autónomo de operaciones. Los nodos son una forma gráfica de representar estas operaciones, y cada nodo tiene un icono único. Los nodos se enlazan en el lienzo en un flujo para un procesamiento más complejo y la generación de datos.

Scripts

Puede utilizar secuencias de comandos en Synthetic Data Generator para automatizar tareas que son muy repetitivas o que requieren mucho tiempo si se realizan manualmente. Los scripts pueden realizar los mismos tipos de acciones que los usuarios con un ratón o un teclado, y puede escribir scripts en Python o Python para Spark.

Más información