N-Perzentile (gleiche Anzahl oder gleiche Summe)
Mit der Klassiermethode für n-Perzentil erstellen Sie nominale Felder, mit denen die gescannten Datensätze so in Perzentilgruppen (oder Quartilgruppen, Dezilgruppen usw.) aufgeteilt werden können, dass jede Gruppe dieselbe Anzahl an Datensätzen aufweist oder dass die Summe der Werte in den einzelnen Gruppen gleich ist. Die Datensätze werden in aufsteigender Reihenfolge gemäß dem Wert des angegebenen Klassenfelds eingestuft. Datensätze mit dem niedrigsten Wert für die ausgewählte Klassenvariable erhalten somit den Rang 1, die nächste Gruppe von Datensätzen den Rang 2 usw. Die Schwellenwerte für die einzelnen Klassen werden automatisch auf der Grundlage der Daten und der verwendeten N-Perzentil-Methode generiert.
Namenserweiterung für N-Perzentile. Geben Sie eine Erweiterung an, die für die mithilfe von Standard-N-Perzentilen generierten Felder verwendet wird. Die Standarderweiterung ist _TILE plus N; dabei steht N für die Nummer des Perzentils. Außerdem können Sie angeben, ob die Erweiterung am Anfang (Präfix) oder am Ende (Suffix) des Feldnamens eingefügt werden soll. Sie könnten beispielsweise ein neues Feld namens Einkommen_BIN4 erstellen.
Namenserweiterung für benutzerdef. N-Perzentil. Dient zur Angabe einer Erweiterung für einen benutzerdefinierten N-Perzentil-Bereich. Die Standarderweiterung lautet _TILEN. N wird in diesem Fall nicht durch die benutzerdefinierte Zahl ersetzt.
Folgende N-Perzentile stehen zur Verfügung:
- Quartil. Generiert vier Klassen, die jeweils 25 % der Fälle enthalten.
- Quintil. Generiert fünf Klassen, die jeweils 20 % der Fälle enthalten.
- Dezil. Generiert zehn Klassen, die jeweils 10 % der Fälle enthalten.
- Vingtil. Generiert 20 Klassen, die jeweils 5 % der Fälle enthalten.
- Perzentil. Generiert 100 Klassen, die jeweils 1% der Fälle enthalten.
- Benutzerdef. N. Wählen Sie diese Option aus, um die Anzahl der Klassen festzulegen. Der Wert 3 beispielsweise ergibt 3 in Bereiche eingeteilte Kategorien (2 Trennwerte), die jeweils 33,3 % der Fälle enthalten.
Falls weniger diskrete Werte in den Daten vorhanden sind als N-Perzentile angegeben wurden, werden nicht alle N-Perzentile verwendet. In diesen Fällen spiegelt die neue Verteilung vermutlich die ursprüngliche Verteilung der Daten wider.
Perzentilmethode. Legt fest, welche Methode für die Zuweisung der Datensätze zu den Klassen verwendet wird.
- Datensatzanzahl. Versucht, jeder Klasse eine gleich große Anzahl an Datensätzen zuzuweisen.
- Summe. Versucht die Datensätze so zu den Klassen zuzuweisen, dass die Summe der Werte in jeder Klasse gleich groß ist. Bei der Zielausrichtung von Absatzbemühungen sind Sie mit dieser Methode beispielsweise in der Lage, die Interessenten gemäß dem Wert je Datensatz zu Dezilgruppen zuzuweisen, wobei die Interessenten mit den höchsten Werten zur obersten Klasse gehören. Beispiel: Ein Pharmaunternehmen stuft die Ärzte gemäß der Anzahl ihrer Verschreibungen in Dezilgruppen ein. Jedes Dezil umfasst in etwa dieselbe Anzahl an Verschreibungen; die Anzahl der Personen, die diese Verschreibungen ausgestellt haben, ist jedoch nicht identisch. Die Personen mit den meisten Verschreibungen würden sich dabei in Dezil 10 wiederfinden. Hinweis: Bei dieser Vorgehensweise wird angenommen, dass alle Werte größer als null sind; ist dies nicht der Fall, können unerwartete Ergebnisse eintreten.
Bindungen. Eine Bindungsbedingung entsteht, wenn beide Seiten eines Trennwerts identisch sind. Wenn Sie beispielsweise Dezile zuweisen und mehr als 10 % der Datensätze denselben Wert im Klassenfeld aufweisen, können nicht alle Datensätze in derselben Klasse untergebracht werden, ohne den Schwellenwert entsprechend nach oben oder nach unten zu verschieben. Die Bindungen können wahlweise aufwärts in die nächste Klasse verschoben oder auch in der aktuellen Klasse beibehalten werden; die Bindungen müssen jedoch in jedem Fall aufgelöst werden, sodass alle Datensätze mit identischen Werten in dieselbe Klasse fallen, auch wenn dadurch einige Klassen mehr Datensätze erhalten als erwartet. Auch die Schwellenwerte der nachfolgenden Klassen müssen angepasst werden, sodass die Werte für dieselbe Zahlengruppe unterschiedlich zugewiesen werden, je nach der verwendeten Methode zum Auflösen der Bindungen.
- Zu nächstem hinzu. Wählen Sie diese Option aus, um die Bindungswerte nach oben zur nächsten Klasse zu verschieben.
- In aktuellem beibehalten. Hiermit werden die Bindungswerte in der aktuellen (niedrigeren) Klasse belassen. Bei dieser Methode werden insgesamt gegebenenfalls weniger Klassen erstellt.
- Zufällig zuweisen. Wählen Sie diese Option aus, um die Bindungswerte nach dem Zufallsprinzip einer Klasse zuzuordnen. Dadurch wird versucht, die Anzahl der Datensätze in jeder Klasse gleich zu halten.
Beispiel: N-Perzentil-Einteilung nach Anzahl der Datensätze
Die folgende Tabelle zeigt, wie vereinfachte Feldwerte bei der N-Perzentil-Einteilung nach Anzahl der Datensätze als Quartile eingestuft werden. Die Ergebnisse sind dabei abhängig von der ausgewählten Bindungsoption.
| Werte | Zu nächstem hinzu | In aktuellem beibehalten |
|---|---|---|
| 10 | E | E |
| 13 | 2 | E |
| 15 | 3 | 2 |
| 15 | 3 | 2 |
| 20 | 4 | 3 |
Die Anzahl der Elemente pro Klasse wird folgendermaßen berechnet:
Gesamtzahl der Werte/Anzahl der N-Perzentile
In dem vereinfachten Beispiel oben ist die erwünschte Anzahl der Elemente pro Klasse 1,25 (5 Werte/4 Quartile). Der Wert 13 (Wert Nummer 2) überspannt den gewünschten Schwellenwert für die Anzahl (1,25) und wird daher, je nach der ausgewählten Bindungsoption, unterschiedlich behandelt. Im Modus Zu nächstem hinzu wird er in Klasse 2 aufgenommen. Im Modus In aktuellem beibehalten wird er in Klasse 1 belassen, wodurch der Wertebereich für Klasse 4 so weit verschoben wird, dass er außerhalb des Bereichs der vorhandenen Datenwerte liegt. Daher werden nur drei Klassen erstellt und die Schwellenwerte für jede Klasse werden entsprechend angepasst, wie in der folgenden Tabelle gezeigt.
| Klasse | Unterer Bereich | Oberer Bereich |
|---|---|---|
| E | >=10 | <15 |
| 2 | >=15 | <20 |
| 3 | >=20 | <=20 |
Hinweis: Die Geschwindigkeit beim Klassieren nach N-Perzentilen kann gegebenenfalls durch Parallelverarbeitung gesteigert werden.