匿名化节点
通过使用匿名化节点,您可以在处理要包含在节点的下游模型中的数据时对字段名称和/或字段值进行掩饰。这样,可以随意分发所生成的模型(例如,分发至技术支持部门),而未授权用户无法查看机密数据(例如,员工记录或患者的医疗记录)。
您可能需要对其他节点进行更改,具体取决于匿名化节点在流中的位置。例如,如果通过使用“选择”节点在上游中插入一个匿名化节点,那么该“选择”节点中的选择标准作用于现已匿名化的值时,这些标准需要进行更改。
用于匿名化的方法取决于多种因素。对于字段名称以及除“连续”测量级别外的所有字段值,数据将替换为以下形式的字符串:
prefix_Sn
其中 prefix_ 是用户指定的字符串或缺省字符串 anon_,n 是从 0 开始并在遇到每个唯一值时递增(例如,anon_S0、anon_S1 等)的整数值。
类型为“连续”的字段值必须进行变换,因为数值范围处理的是整数或实数值,而不是字符串。因此,只能通过将范围变换为不同范围对字段值进行匿名化,从而掩饰原始数据。范围内的值 x 的变换按以下方法执行:
A*(x + B)
其中:
A 是比例因子,必须大于 0。
B 是要为值增加的转换偏移量。
示例
对于年龄字段,如果比例因子 A 设置为 7 而转换偏移量 B 设置为 3,那么年龄的值将转换为:
7*(AGE + 3)