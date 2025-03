Uma das vantagens de usar dados sintéticos é que eles não contêm dados confidenciais ou PII. No entanto, as empresas ainda devem verificar se os novos dados gerados estão em conformidade com os regulamentos de privacidade. Como o Regulamento Geral de Proteção de Dados (GDPR) da União Europeia ou a Lei de portabilidade e responsabilidade de planos de saúde (HIPAA) dos EUA.

Trate os dados sintéticos como dados proprietários, aplicando medidas de segurança incorporadas e controles de acesso para evitar violações e vazamentos de dados. Também devem ser aplicadas proteções durante o processo de geração para mitigar o risco de que os dados sintéticos sejam revertidos e rastreados até sua versão real, expondo informações confidenciais durante a análise de dados. Essas proteções incluem técnicas como mascaramento para ocultar ou disfarçar dados sensíveis, anonimização para remover ou apagar informações de identificação pessoal (PII) e privacidade diferencial para adicionar “ruído” ou introduzir aleatoriedade ao conjunto de dados.

“No mínimo, é necessário mascarar ou remover informações de identificação pessoal (PII), mas também é possível ir além e utilizar métodos de privacidade diferencial”, diz Srivastava. “Isso se torna ainda mais crítico quando não se utilizam modelos locais. Se você estiver enviando [dados] para um provedor terceirizado, é fundamental tomar cuidados extras com esses aspectos.”

Observe que os dados sintéticos geralmente não podem ser otimizados simultaneamente para fidelidade, utilidade e privacidade— muitas vezes, há uma compensação. O mascaramento ou a anonimização podem reduzir nominalmente a utilidade, enquanto a privacidade diferencial pode diminuir ligeiramente a precisão. No entanto, não implementar nenhuma medida de privacidade pode expor as IIP. As organizações devem equilibrar e priorizar o que é crucial para seus casos de uso específicos.