Multidimensionale Skalierung: Unähnlichkeitsmaße bei binären Daten

Die folgenden Unähnlichkeitsmaße sind für binäre Daten verfügbar:

Euklidische Distanz. Berechnet aus einer Vier-Felder-Tabelle als SQRT(b+c). Dabei stehen b und c für die den Fällen entsprechenden Zellen in der Diagonalen, die in einem Element vorhanden sind, im anderen jedoch fehlen.

Quadrierte euklidische Distanz. Berechnet als die Anzahl unharmonischer Fälle. Der Minimalwert beträgt 0, es besteht keine Obergrenze.

Größendifferenz. Ein Index für Asymmetrie. Der Bereich liegt zwischen 0 und 1, jeweils einschließlich.

Musterdifferenz. Unähnlichkeitsmaß für binäre Daten im Bereich von 0 bis 1. Berechnet aus einer Vier-Felder-Tabelle als bc/ (n** 2), wobei b und c die Zellen in der Diagonale darstellen, die den Fällen entsprechen, die auf einem Element vorhanden sind, auf dem anderen jedoch nicht vorhanden sind, und n ist die Gesamtzahl der Beobachtungen.

die Varianz erklärt wird. Berechnet aus einer Vier-Felder-Tabelle als (b+c)/4n. Dabei stehen b und c für die den Fällen entsprechenden Zellen in der Diagonalen, die in einem Element vorhanden sind, aber im anderen fehlen. n ist die Gesamtzahl der Beobachtungen. Der Bereich liegt zwischen 0 und 1, jeweils einschließlich.

Distanzmaß nach Lance und Williams. Berechnet aus einer Vier-Felder-Tabelle als (b + c)/(2a + b + c), wobei a die Zelle darstellt, die den Fällen entspricht, welche in beiden Elementen vorhanden sind, und b und c die Zellen in der Diagonale darstellen, die den Fällen entsprechen, die auf einem Element vorhanden sind, aber auf dem anderen fehlen. Diese Größe hat einen Bereich von 0 bis 1. (Auch bekannt als nicht metrischer Koeffizient nach Bray-Curtis.)

Sie können die Felder "Vorhanden" und "Nicht vorhanden" ändern, um die Werte festzulegen, die eine Eigenschaft als "vorhanden" oder "nicht vorhanden" kennzeichnen. Alle anderen Werte werden von der Prozedur ignoriert.