Feature-Highlights

Registerkarte Variables

Das Dialogfenster Validate Data wird zur Überprüfung von Daten verwendet. Auf der Registerkarte Variables werden die Variablen in Ihrer Datei angezeigt. Beginnen Sie mit der Auswahl der gewünschten Variablen und verschieben Sie diese in die Liste Analysis Variables.

Basisprüfungen

Sie können Basisprüfungen angeben, die auf die Variablen und Fälle in Ihrer Datei angewendet werden sollen. Sie können z. B. Berichte abrufen, in denen Variablen mit einem hohen Prozentsatz an fehlenden Werte oder leeren Fällen identifiziert werden.

Standardmäßige und angepasste Regeln

Wenden Sie Regeln auf einzelne Variablen an, die ungültige Werte identifizieren, d. h. Werte außerhalb eines gültigen Bereichs oder fehlende Werte. Sie können auch eigene Regeln und variablenübergreifende Regeln festlegen oder vordefinierte Regeln anwenden.

Empfehlungen

Die automatisierte Datenaufbereitung liefert Empfehlungen und bietet dem Benutzer die Möglichkeit, diese Empfehlungen detailliert zu analysieren.

Datenaufbereitung in einem einzigen Schritt – automatisch

Die manuelle Datenaufbereitung ist ein komplexer und zeitaufwendiger Prozess. Wenn Sie schnell Ergebnisse erreichen müssen, können Sie mit dem ADP-Verfahren in nur einem Schritt Qualitätsfehler erkennen und beheben sowie fehlende Werte zuordnen. Die ADP-Funktion liefert einen leicht verständlichen Bericht mit zahlreichen Empfehlungen und Darstellungen, damit Sie die richtigen Daten zur Verwendung in der Analyse bestimmen.

Zusätzliche Optionen für die Datenaufbereitung

Führen Sie automatische Datenprüfungen durch und vermeiden Sie zeitaufwendige, umständliche manuelle Prüfungen durch die Verwendung des Verfahrens zur Datenprüfung. Bei diesem Verfahren können Sie Regeln zur Durchführung von Datenprüfungen auf der Grundlage der Maßnahmenebene jeder Variable anwenden (eindeutig oder fortlaufend). Sie können anschließend die Gültigkeit der Daten bestimmen und verdächtige Fälle vor der Analyse nach eigenem Ermessen entfernen oder korrigieren.

Einteilung oder Festlegung von Trennwerten für metrische Variablen

Mit dem optimalen Binning-Verfahren können Sie Algorithmen, die für nominale Attribute entwickelt wurden, präziser verwenden (z. B. Naive Bayes und Logit-Modelle). Ein optimales Binning bietet Ihnen die Möglichkeit, Trennwerte für metrische Variablen einzuteilen oder festzulegen.

Auswahl zwischen drei Arten von optimalem Binning

Wählen Sie eine dieser Arten für das optimale Binning zur Vorverarbeitung von Daten vor der Modellerstellung aus. 1) Nicht überwacht: Erstellen Sie Bins mit gleicher Anzahl. 2) Überwacht: Beziehen Sie die Zielvariable mit ein, um Trennwerte festzulegen. Diese Vorgehensweise ist präziser als die nicht überwachte Methode, allerdings ist sie auch rechenintensiver. 3) Hybrider Ansatz: Kombiniert die nicht überwachte und die überwachte Methode miteinander. Diese Methode bietet sich insbesondere bei größeren Mengen unterschiedlicher Werte an.

Technische Details

Softwarevoraussetzungen

IBM SPSS Data Preparation erfordert eine gültige IBM SPSS Statistics-Basislizenz.

  • Voraussetzung: IBM SPSS Statistics

Hardwarevoraussetzungen

  • Prozessor: 2 GHz oder schneller
  • Anzeige: 1024*768 oder höher
  • Hauptspeicher: 4 GB RAM erforderlich, 8 GB RAM oder mehr empfohlen
  • Plattenspeicher: 2 GB oder mehr

Funktionsweise sehen

Jetzt kaufen und loslegen