Messniveaus

Das Messniveau (früher "Datentyp" oder "Verwendung" genannt) beschreibt die Nutzung der Datenfelder in IBM® SPSS Modeler. Das Messniveau kann auf der Registerkarte "Typen" eines Quellenknotens oder Typknotens festgelegt werden. Beispiel: Sie möchten das Messniveau für ein Feld ganzer Zahlen mit den Werten 1 und 0 auf Flag setzen. Das bedeutet normalerweise, dass 1=True und 0=False ist.

Speicherung versus Messung. Das Messniveau eines Felds unterscheidet sich dessen Speichertyp, der angibt, ob die Daten als Zeichenfolge, ganze Zahl, reelle Zahl, Datum, Zeit oder Zeitmarke gespeichert werden sollen. Während die Datentypen mithilfe eines Typknotens an jeder beliebigen Stelle im Stream geändert werden können, muss der Speichertyp beim Lesen der Daten in IBM SPSS Modeler stets an der Quelle festgelegt werden (kann jedoch später mithilfe einer Konvertierungsfunktion geändert werden). Weitere Informationen finden Sie in Festlegen von Feldspeicher und Formatierung.

Bei einigen Modellierungsknoten werden die zulässigen Messniveautypen für die Eingabe- und Zielfelder durch Symbole auf der Registerkarte "Felder" angegeben.

Messniveausymbole

Tabelle 1. Messniveausymbole
Symbol Messniveau
Standard
Stetig
Kategorial
Flag
Nominal
Ordinal
Ohne Typ
Sammlung
Georäumlich

Die folgenden Messniveaus stehen zur Verfügung:

  • Standard Daten mit unbekanntem Speichertyp und unbekannten Werten (z. B. weil sie noch nicht gelesen wurden), werden als <Standard> angezeigt.
  • Stetig Wird zur Beschreibung numerischer Werte verwendet, beispielsweise des Bereichs 0-100 oder 0,75-1,25. Ein stetiger Wert kann eine ganze Zahl, eine reelle Zahl oder ein Datum/eine Uhrzeit sein.
  • Kategorial Wird für Zeichenfolgewerte verwendet, wenn eine exakte Anzahl unterschiedlicher Werte nicht bekannt ist. Dies ist ein Datentyp ohne Instanz, was bedeutet, dass nicht alle möglichen Informationen zur Speicherung und Verwendung der Daten bereits bekannt sind. Nach dem Lesen der Daten ist das Messniveau Flag, Nominal oder Ohne Typ (abhängig von der maximalen Anzahl an Mitgliedern für nominale Felder, die im Dialogfeld "Streameigenschaften" angegeben wurde). .
  • Flag Wird für Daten mit zwei unterschiedlichen Werten verwendet, die auf das Vorhandensein bzw. Nichtvorhandensein eines Merkmals hinweisen, wie etwa true (wahr) und false (falsch), Yes (Ja) und No (Nein) oder 0 und 1. Die verwendeten Werte können abweichen, aber ein Wert muss immer als "wahr" und der andere als "falsch" festgelegt sein. Die Daten können als Text, ganze Zahl, reelle Zahl, Datum/Uhrzeit oder Zeitmarke dargestellt sein.
  • Nominal Wird verwendet, um Daten mit mehreren unterschiedlichen Werten zu beschreiben, von denen jeder als Mitglied eines Sets behandelt wird, beispielsweise klein/mittel/groß. Nominale Daten können jeden beliebigen Speichertyp aufweisen: "Numerisch", "Zeichenfolge" oder "Datum/Uhrzeit". Hinweis: Durch das Setzen des Messniveaus auf Nominal werden nicht automatisch die Werte auf Zeichenfolgenspeicherung geändert.
  • Ordinal Wird zur Beschreibung von Daten mit mehreren unterschiedlichen Werten verwendet, die eine natürliche Reihenfolge aufweisen. Gehaltskategorien oder Zufriedenheitsbewertungen beispielsweise können als ordinale Daten klassifiziert werden. Die Reihenfolge wird durch die natürliche Sortierfolge der Datenelemente definiert. So ist 1, 3, 5 die Standardsortierreihenfolge für eine Menge von ganzen Zahlen, während HOCH, NIEDRIG, NORMAL (aufsteigende alphabetische Reihenfolge) die Reihenfolge für eine Menge von Zeichenfolgen ist. Mit dem ordinalen Messniveau können Sie eine Menge kategorialer Daten als ordinale Daten festlegen - zum Zwecke der Visualisierung, Modellerstellung und zum Export in andere Anwendungen, beispielsweise IBM SPSS Statistics, die ordinale Daten als gesonderten Typ erkennen. Sie können ein ordinales Feld überall dort verwenden, wo sich ein nominales Feld verwenden lässt. Außerdem können Felder jedes beliebigen Speichertyps ("Reelle Zahl", "Ganzzahl", "Zeichenfolge", "Datum", "Zeit" usw.) als "ordinal" definiert werden.
  • Ohne Typ Wird für Daten verwendet, die keinem der oben angegebenen Typen entsprechen, für Felder mit einem einzelnen Wert bzw. für nominale Daten, in denen das Set mehr Mitglieder als das definierte Maximum enthält. Dieser Typ ist auch sinnvoll in Fällen, in denen das Messniveau ansonsten ein Set mit zu vielen Mitgliedern wäre (beispielsweise eine Kontonummer). Bei Auswahl von Ohne Typ für ein Feld wird für die Rolle automatisch Keine festgelegt, wobei Datensatz-ID die einzige Alternative ist. Die Standardmaximalgröße für Sets liegt bei 250 eindeutigen Werten. Diese Zahl kann auf der Registerkarte "Optionen" des Dialogfelds "Streameigenschaften" (Zugriff über das Menü "Tools") angepasst oder inaktiviert werden.
  • Sammlung Dient zur Angabe nicht georäumlicher Daten, die in einer Liste erfasst werden. Eine Sammlung ist im Grunde ein Listenfeld mit einer Tiefe von null, wobei die Elemente in dieser Liste eine der anderen Messniveaus aufweisen.

    Weitere Informationen zu Listen finden Sie in Listenspeicher und zugehörige Messniveaus.

  • Georäumlich Wird mit dem Speichertyp Liste zur Angabe von Geodaten verwendet. Listen können aus dem Feld Ganzzahlliste oder Liste reeller Zahlen mit einer Listentiefe zwischen null und zwei (einschließlich) bestehen.

    Weitere Informationen finden Sie in Georäumliche Untermessniveaus.

Sie können die Messniveaus wahlweise manuell festlegen oder auch die Daten durch die Software einlesen und dann das Messniveau auf der Grundlage der eingelesenen Werte automatisch bestimmen lassen.

Alternativ können Sie bei mehreren stetigen Datenfeldern, die als kategoriale Daten behandelt werden sollen, eine Option auswählen, um sie umzuwandeln. Weitere Informationen finden Sie in Umwandeln stetiger Daten.

So verwenden Sie die automatische Typfestlegung:

  1. Setzen Sie in einem Typknoten oder auf der Registerkarte "Typen" eines Quellenknotens die Spalte Werte für die gewünschten Felder auf <Lesen>. Dadurch werden die Metadaten für alle nachgeordneten Knoten verfügbar. Mit den Sonnenbrillenschaltflächen im Dialogfeld können Sie schnell und einfach alle Felder auf <Lesen> oder <Übergeben> setzen.
  2. Klicken Sie auf Werte lesen, um sofort die Werte aus der Datenquelle zu lesen.

So legen Sie das Messniveau für ein Feld manuell fest:

  1. Wählen Sie ein Feld in der Tabelle aus.
  2. Wählen Sie in der Dropdown-Liste in der Spalte Messung ein Messniveau für das Feld aus.
  3. Alternativ können Sie mit Strg-A oder Strg-Klicken mehrere Felder auswählen, bevor Sie in der Dropdown-Liste ein Messniveau auswählen.