匿名化節點

通過使用匿名化節點,您可以在處理要包含在節點的下游模型中的資料時對欄位名稱和/或欄位值進行掩飾。這樣,可以隨意分發所產生的模型(例如,分發至技術支援部門),而未授權使用者無法檢視機密資料(例如,員工記錄或病患的醫療記錄)。

您可能需要對其他節點進行變更,具體取決於匿名化節點在串流中的位置。例如,如果在「選擇」節點上游中插入一個匿名化節點,那麼該「選擇」節點中的選擇準則作用於現已匿名化的值時,這些準則需要進行變更。

用於匿名化的方法取決於多種因素。對於欄位名稱以及除「連續」測量層次外的所有欄位值,資料將取代為以下形式的字串:


prefix_Sn

其中 prefix_ 是使用者指定的字串或預設字串 anon_n 是從 0 開始並在遇到每個唯一值時遞增(例如,anon_S0anon_S1 等)的整數值。

類型為「連續」的欄位值必須進行轉換,因為數值型範圍處理的是整數或實數值,而不是字串。因此,只能通過將範圍轉換為不同範圍對字段值進行匿名化,從而掩飾原始資料。範圍內的值 x 的轉換按下列方法執行:

A*(x + B)

其中:

A 是比例係數,必須大於 0。

B 是要為值增加的轉換偏移量。

範例

對於年齡欄位,如果比例係數 A 設定為 7 而轉換偏移量 B 設定為 3,那麼年齡的值將轉換為:

7*(AGE + 3)