Mascarar dados com regras de proteção de dados ( IBM watsonx.data intelligence )
Para mascarar os dados, eles devem estar em conformidade com estes requisitos:
- Os dados estão estruturados. Os dados devem estar em tabelas relacionais ou CSV, Avro, dados particionados ou arquivos Parquet.
- Os cabeçalhos da coluna contêm apenas caracteres alfanuméricos (a-z, A-Z, 0-9). Os cabeçalhos da coluna não podem conter caracteres não suportados, como caracteres de multibyte ou caracteres especiais.
Ao escolher a ação de mascaramento, deve-se especificar os critérios de mascaramento e o método de mascaramento.
Critérios de mascaramento
Os critérios de mascaramento identificam as colunas para mascarar. Você seleciona o tipo de propriedade da coluna, e especifica um ou mais valores específicos da propriedade, que são combinados logicamente com o operador OU.
| Tipo de propriedade da coluna | Descrição | Valores específicos |
|---|---|---|
| Termo de negócios | Um termo de negócio que é designado à coluna. | Procure e, em seguida, selecione um ou mais termos de negócios publicados. |
| Classe de dados | A classe de dados que é designada à coluna. | Procure e, em seguida, selecione uma ou mais classes de dados publicadas. |
| Tag | Uma tag que é designada a uma coluna no ativo. | Insira uma ou mais tags, separadas por vírgulas. |
| Nome da coluna | O nome de uma coluna. | Insira um ou mais nomes de colunas, separados por vírgulas. |
Por exemplo, suponhamos que você escolha a propriedade da coluna de Classe de dados e os valores específicos da Licença de Motorista do Estado da Califórnia e da Licença de Motorista do Estado de Nevada. Os valores são, então, mascarados em colunas que são designadas à classe de dados de Licença de Motorista do Estado da Califórnia ou de Licença de Motorista do Estado de Nevada.
Visão geral de métodos de mascaramento
As principais diferenças entre os métodos de masking são o quanto das características originais dos dados permanecem. Quanto mais originais as características dos dados retidos, mais úteis, porém menos seguros, os dados mascarados se tornam. Quando você escolhe um método de mascaramento, considere estes fatores:
Integridade de dados: se deve repetir o mesmo valor mascarado para um valor original repetido para manter a integridade referencial entre tabelas.
Formato de dados: se deve reter o formato dos dados originais. Preservar o formato significa que as letras são substituídas por letras com as mesmas maiúsculas e minúsculas, os dígitos são substituídos por dígitos e o número de caracteres é o mesmo.
A tabela a seguir descreve como cada método de mascaramento afeta essas características.
| Método | Descrição | Preserva a integridade? | Preserva o formato de dados? |
|---|---|---|---|
| Redact | Por padrão, substitui os valores por dez caracteres X. O método mais seguro. Você pode personalizar o caractere de substituição e o número de caracteres de substituição. Para colunas que possuem algumas classes de dados designadas, é possível escolher substituição parcial. |
Não | Não: Se você não estiver usando opções avançadas de mascaramento. Sim: Se você estiver usando opções avançadas de mascaramento. |
| Substituir | Substituir valores por valores gerados aleatoriamente que preservam a integridade referencial. | True | Não |
| Ofuscar | Substituir valores por valores que preservam a integridade referencial e o formato de dados original. O método menos seguro. | True | True |
Editar
É possível redação de dados usando dois métodos diferentes.
O método redact básico substitui cada valor de dados por uma sequência de exatamente dez letras de X. Com dados editados, o formato e a integridade dos dados não são preservados. Editar é o método de mascaramento mais seguro, mas resulta nos dados menos úteis mascarados.
Por exemplo, o número de telefone 510-555-1234 é substituído por XXXXXXXXXX. Todos os outros números de telefone são substituídos pelo mesmo valor.
Substituir
O método substituto substitui dados por valores que não correspondem ao formato original. No entanto, ele preserva a integridade referencial para valores repetidos para todos os ativos do catálogo. Os valores substituídos são sem sentido e o formato original dos valores não pode ser determinado. Substituir fornece segurança e utilidade de dados entre os métodos Editar e Ofuscar.
Por exemplo, o número de telefone 510-555-1234 é sempre substituído por 500ddcc98133703531re3456.
Ofuscar
O método ofuscar substitui os valores de dados por valores similarmente formatados que correspondem ao formato original e preserva a integridade referencial para valores repetidos. Como os valores ofuscados são formatados de forma semelhante, eles podem ser valores válidos. Ofuscar é o método de mascaramento menos seguro, mas resulta nos dados mascarados mais úteis.
Por exemplo, o número de telefone 510-555-1234 é sempre substituído por 415-987-6543.
No entanto, o método ofuscar é limitado a valores de dados em colunas que designaram classes de dados aos tipos de informações a seguir:
- Informações pessoais, por exemplo, atributos básicos de um indivíduo, como o honorífico ou o sufixo de nome.
- Detalhes de contato, por exemplo, endereço de e-mail, números de telefone, estado, endereços postais, latitude ou longitude.
- Contas financeiras, por exemplo, cartões de crédito, bancos ou outros números de conta financeira.
- Entidades do governo, por exemplo, números de identificação pessoal emitidos pelos governos, como SSN (números de seguridade social dos EUA) e CCN (números de cartão de crédito).
- Informações demográficas pessoais, por exemplo, religião, etnia, estado civil, hobbies ou status de funcionário.
- Dados de conectividade, por exemplo, endereço IP ou endereço mac.
Se você criar uma regra para ofuscar dados e a regra for impingida em dados que não são designados a uma classe de dados que suporte a ofuscação, o método substituto é usado como alternativa.
Assista a este vídeo para ver como mascarar dados.
Este vídeo fornece um método visual para aprender os conceitos e tarefas nesta documentação.