多维刻度: 二分类数据非相似性测量
以下非相似性测量可用于二元数据:
欧氏距离。 根据四重表计算 SQRT(b+c) 得到,其中 b 和 c 代表对应于在一项上存在但在另一项上不存在的个案的对角线单元格。
平方 Euclidean 距离。 计算非协调的个案的数目。它的最小值为 0,没有上限。
刻度差分。 非对称性指数。其范围为 0 到 1。
模式差分。 用于二分类数据的非相似性测量,其范围为 0 到 1。根据四重表计算 bc/(n**2) 得到,其中 b 和 c 代表对应于在一项上存在但在另一项上不存在的个案的对角线单元格,n 为观察值的总数。
方差。 根据四重表计算 (b+c)/4n 得到,其中 b 和 c 代表对应于在一项上存在但在另一项上不存在的个案的对角线单元格,n 为观察值的总数。其范围为 0 到 1。
Lance 和 Williams。 根据四重表计算 (b+c)/(2a+b+c) 得到,其中 a 代表对应于两项上都存在的个案的单元格,而 b 和 c 代表对应于在一项上存在但在另一项上不存在的个案的对角线单元格。此度量的范围为 0 到 1。(也称为 Bray-Curtis 非量度系数。)
(可选)您可以更改“存在”和“不存在”字段以指定可指示某个特征存在或不存在的值。该过程将忽略所有其他值。