匿名化节点

通过使用匿名化节点，您可以在处理要包含在节点的下游模型中的数据时对字段名称和/或字段值进行掩饰。这样，可以随意分发所生成的模型（例如，分发至技术支持部门），而未授权用户无法查看机密数据（例如，员工记录或患者的医疗记录）。

您可能需要对其他节点进行更改，具体取决于匿名化节点在流中的位置。例如，如果通过使用“选择”节点在上游中插入一个匿名化节点，那么该“选择”节点中的选择标准作用于现已匿名化的值时，这些标准需要进行更改。

用于匿名化的方法取决于多种因素。对于字段名称以及除“连续”测量级别外的所有字段值，数据将替换为以下形式的字符串：


prefix_Sn

其中 prefix_ 是用户指定的字符串或缺省字符串 anon_，n 是从 0 开始并在遇到每个唯一值时递增（例如，anon_S0、anon_S1 等）的整数值。

类型为“连续”的字段值必须进行变换，因为数值范围处理的是整数或实数值，而不是字符串。因此，只能通过将范围变换为不同范围对字段值进行匿名化，从而掩饰原始数据。范围内的值 x 的变换按以下方法执行：

A*(x + B)

其中：

A 是比例因子，必须大于 0。

B 是要为值增加的转换偏移量。

示例

对于年龄字段，如果比例因子 A 设置为 7 而转换偏移量 B 设置为 3，那么年龄的值将转换为：

7*(AGE + 3)