Меры различия для двоичных данных в процедуре Многомерное масштабирование
Для двоичных данных доступны следующие меры различия:
Расстояние Евклида. Вычисляется по таблице с четырьмя клетками как SQRT(b+c), где b и c представляют диагональные клетки с подсчетами числа случаев несовпадения значений для объектов, между которыми вычисляется расстояние.
Квадрат расстояния Евклида. Вычисляется как число случаев несовпадения значений. Минимальное значение равно 0, верхнего предела нет.
Различие размеров. Индекс асимметрии. Изменяется в диапазоне от 0 до 1.
Различие структур. Мера различия для бинарных данных, изменяющаяся от 0 до 1. Вычисляется по таблице с четырьмя клетками как bc/(n**2), где b и c представляют диагональные клетки с подсчетами числа случаев несовпадения значений для объектов, между которыми вычисляется расстояние, а n является суммарным числом совпадений и несовпадений.
Дисперсия. Вычисляется по таблице с четырьмя клетками как (b+c)/4n, где b и c представляют диагональные клетки с подсчетами числа случаев несовпадения значений для объектов, между которыми вычисляется расстояние, а n является суммарным числом совпадений и несовпадений. Изменяется в диапазоне от 0 до 1.
Ланс и Уильямс. Вычисляется по таблице с четырьмя клетками как (b+c)/(2a+b+c), где a представляет клетку с подсчетом числа случаев наличия признака для обоих объектов, а b и c представляют диагональные клетки с подсчетами числа случаев несовпадения значений для объектов. Изменяется в диапазоне от 0 до 1. (Известен также как неметрический коэффициент Брэя-Куртиса).
Дополнительно вы можете изменить поля Наличие и Отсутствие, задавая значения, обозначающие присутствие и отсутствие признака. Все другие значения будут игнорироваться процедурой.