Ziele (lineare Modelle)

Wie lautet Ihr Hauptziel? Wählen Sie das entsprechende Ziel aus.

  • Standardmodell erstellen. Bei der Methode wird ein einziges Modell erstellt, um das Ziel unter Verwendung der Prädiktoren vorherzusagen. In der Regel gilt, dass Standardmodelle einfacher interpretiert und schneller gescort werden können, als verbesserte, verstärkte oder große Dataset-Ensembles.
  • Modellgenauigkeit verbessern (Boosting). Bei der Methode wird mittels Boosting ein Ensemblemodell erstellt. Dabei wird eine Modellsequenz generiert, um genauere Vorhersagen zu erhalten. Möglicherweise nimmt das Erstellen und Scoren bei Ensembles mehr Zeit in Anspruch als bei Standardmodellen.

    Durch Boosting wird eine Reihe von "Komponentenmodellen" erstellt, von denen jede einzelne Komponente auf dem gesamten Dataset beruht. Vor dem Erstellen jedes aufeinander folgenden Komponentenmodells werden die Datensätze basierend auf den Residuen des vorherigen Komponentenmodells gewichtet. Größere Residuen erhalten eine höhere Analysegewichtung, sodass beim nächsten Komponentenmodell das Augenmerk auf einer hochwertigen Vorhersage dieser Datensätze liegt. Zusammen bilden diese Komponentenmodelle ein Ensemblemodell. Das Ensemblemodell scort basierend auf einer Kombinationsregel neue Datensätze. Die verfügbaren Regeln hängen vom Messniveau des Ziels ab.

  • Modellstabilität verbessern (Bagging). Bei der Methode wird mithilfe von Bagging (Bootstrap-Aggregation) ein Ensemblemodell erstellt. Dabei werden mehrere Modelle generiert, um zuverlässigere Vorhersagen zu erhalten. Möglicherweise nimmt das Erstellen und Scoren bei Ensembles mehr Zeit in Anspruch als bei Standardmodellen.

    Bei der Bootstrap-Aggregation (Bagging) werden Reproduktionen des Trainingsdataset erstellt, indem von der Ersetzung aus dem ursprünglichen Dataset Stichproben genommen werden. Dadurch ergeben sich Bootstrap-Stichproben mit der gleichen Größe wie beim ursprünglichen Dataset. Dann wird von jeder Reproduktion ein "Komponentenmodell" erstellt. Zusammen bilden diese Komponentenmodelle ein Ensemblemodell. Das Ensemblemodell scort basierend auf einer Kombinationsregel neue Datensätze. Die verfügbaren Regeln hängen vom Messniveau des Ziels ab.

  • Erstellen Sie ein Modell für sehr große Datasets (erfordert IBM® SPSS Statistics-Server). Bei dieser Methode wird ein Ensemblemodell durch Aufteilen des Datasets in separate Datenblöcke erstellt. Wählen Sie diese Option aus, wenn Ihr Dataset zu groß für die Erstellung der obigen Modelle oder die inkrementelle Modellerstellung ist. Unter Umständen kann das Modell mit dieser Option schneller als ein Standardmodell erstellt werden, das Scoren dauert jedoch evtl. länger als bei einem Standardmodell. Für diese Option ist eine Verbindung zu IBM SPSS Statistics Server erforderlich.

Informationen zu den Einstellungen für Boosting, Bagging und sehr große DatasetsVerstärkung und Bagging finden Sie unter Ensembles (lineare Modelle).