Modelle der prädiktiven Analysen sind darauf ausgelegt, historische Daten zu bewerten, Muster zu erkennen, Trends zu beobachten und diese Informationen zu nutzen, um zukünftige Trends vorherzusagen. Beliebte prädiktive Analysemodelle sind Klassifizierung, Clustering und Zeitreihen-Modelle.
Klassifikationsmodelle
Klassifizierungsmodelle fallen in die Kategorie von überwachten maschinellen Lernmodellen. Diese Modelle kategorisieren Daten basierend auf historischen Daten und beschreiben Beziehungen innerhalb eines bestimmten Datasets. Dieses Modell kann beispielsweise verwendet werden, um Kunden oder Interessenten zu Segmentierungszwecken in Gruppen zu klassifizieren. Alternativ kann es auch zur Beantwortung von Fragen mit binärem Ausgang verwendet werden, z. B. bei den Antworten „Ja“ oder „Nein“ oder „Richtig“ und „Falsch“. Beliebte Anwendungsfälle hierfür sind die Betrugserkennung und die Bewertung von Kreditrisiken. Zu den Klassifizierungsmodellen gehören logistische Regression, Entscheidungsbäume, Random Forest, neuronale Netze und Naïve Bayes.
Clustering-Modelle
Clustering-Modelle fallen in die Kategorie unüberwachtes Lernen. Sie gruppieren Daten basierend auf ähnlichen Attributen. Beispielsweise kann eine E-Commerce-Website das Modell verwenden, um Kunden basierend auf gemeinsamen Merkmalen in ähnliche Gruppen zu unterteilen und Marketingstrategien für jede Gruppe zu entwickeln. Zu den gängigen Clustering-Algorithmen gehören k-Means-Clustering, Mean-Shift-Clustering, dichtebasiertes räumliches Clustering von Anwendungen mit Rauschen (DBSCAN), Clustering zur Erwartungsmaximierung (EM) unter Verwendung von Gaußschen Mischmodellen (GMM) und hierarchisches Clustering.
Zeitreihenmodelle
Zeitreihenmodelle verwenden verschiedene Dateneingaben in einer bestimmten Zeithäufigkeit, z. B. täglich, wöchentlich, monatlich usw. Es ist üblich, die abhängige Variable im Laufe der Zeit darzustellen, um die Daten für Saisonalität, Trends und zyklisches Verhalten zu bewerten, was auf bestimmte Transformationen und Modelltypen hinweisen kann. Autoregressiv (AR), gleitender Durchschnitt (MA), ARMA- und ARIMA-Modelle sind häufig verwendete Zeitreihen-Modelle. Beispielsweise kann ein Callcenter mithilfe eines Zeitreihenmodells vorhersagen, wie viele Anrufe es pro Stunde zu verschiedenen Tageszeiten erhalten wird.