Formeln für den Regressionsalgorithmus

Gilt für : TBM Studio 12.0 und höher

Eine nützliche Funktion von Trenddiagrammen ist die Möglichkeit, Projektionen zu den Diagrammen hinzuzufügen. Die Anwendung bietet eine Reihe von Regressionsalgorithmen, die auf Projektionen angewendet werden können. Die Algorithmen sind:
  • Regression
  • Multiple lineare Regression
  • Polynomielle Regression
  • Einfache Exponentialglättung
  • Doppelte Exponentialglättung
  • Gleitender Durchschnitt

Die Anwendungsalgorithmen basieren auf Standard-Java OpenForecast Regressionsalgorithmen. Die folgenden Beschreibungen sind der Java-Dokumentation entnommen: OpenForecast.

Regression

Implementiert ein einvariables lineares Regressionsmodell. Ein lineares Regressionsmodell mit einer einzigen Variablen versucht im Wesentlichen, eine gerade Linie durch die Datenpunkte zu ziehen. Diese Linie wird durch ihre Steigung und den Schnittpunkt mit der x-Achse definiert (d. h. den Punkt, an dem die unabhängige Variable - vielleicht nur theoretisch - den Wert Null hat). Angenommen, die unabhängige Variable ist x und die abhängige Variable ist y, dann kann diese Linie mathematisch wie folgt dargestellt werden:

y = intercept +
          slope * x

Multiple lineare Regression

Implementiert ein lineares Regressionsmodell mit mehreren Variablen. Bei einem linearen Regressionsmodell mit mehreren Variablen wird im Wesentlichen versucht, eine Hyperebene durch die Datenpunkte zu legen. Angenommen, die unabhängigen Variablen sind xi und die abhängige Variable ist y, dann kann diese Hyperebene mathematisch wie folgt dargestellt werden:

y = a0 + a1*x1 +
          a2*x2 + a3*x3 +

...wobei die ai die Koeffizienten der Regression sind. Der Koeffizient a0 wird auch als Achsenabschnitt bezeichnet. Wären alle xi gleich Null (zumindest theoretisch), wäre dies der Prognosewert der dependentVariable, y.

Polynomielle Regression

Implementiert ein einvariables polynomiales Regressionsmodell. Ein polynomiales Regressionsmodell mit einer einzigen Variablen versucht im Wesentlichen, eine polynomiale Linie (eine Kurve, wenn Sie so wollen) durch die Datenpunkte zu legen. Angenommen, die unabhängige Variable ist x und die abhängige Variable ist y, dann kann diese Linie mathematisch wie folgt dargestellt werden:

y = a0 + a1*x +
          a2*x2 + a3*x3 + ... + am*xm

Einfache exponentielle Glättung

Ein einfaches Prognosemodell mit exponentieller Glättung ist ein sehr beliebtes Modell zur Erstellung einer geglätteten Zeitreihe. Während bei einfachen gleitenden Durchschnittsmodellen die vergangenen Beobachtungen gleich gewichtet werden, werden bei der exponentiellen Glättung mit zunehmendem Alter der Beobachtungen exponentiell abnehmende Gewichte zugewiesen.

Mit anderen Worten: Jüngere Beobachtungen werden bei der Vorhersage relativ stärker gewichtet als ältere Beobachtungen.

Bei gleitenden Durchschnitten sind die den Beobachtungen zugewiesenen Gewichte gleich und entsprechen 1/N. Bei der einfachen exponentiellen Glättung wird jedoch ein Glättungsparameter oder eine Glättungskonstante verwendet, um die den Beobachtungen zugewiesenen Gewichte zu bestimmen.

Dieses einfache Modell der exponentiellen Glättung beginnt damit, dass die Prognose für die zweite Periode mit der Beobachtung der ersten Periode gleichgesetzt wird.

Doppelte exponentielle Glättung

Die doppelte exponentielle Glättung (auch als Holt-Exponential-Glättung bekannt) ist eine Verfeinerung des beliebten einfachen exponentiellen Glättungsmodells, fügt aber eine weitere Komponente hinzu, die jeden Trend in den Daten berücksichtigt. Einfache exponentielle Glättungsmodelle funktionieren am besten bei Daten, die keine Trend- oder Saisonkomponenten enthalten. Wenn die Daten im Laufe der Zeit entweder einen steigenden oder einen fallenden Trend aufweisen, neigen einfache Prognosen mit exponentieller Glättung dazu, hinter den Beobachtungen zurückzubleiben. Die doppelte exponentielle Glättung wurde für diese Art von Datenreihen entwickelt, indem jeder Trend in den Daten berücksichtigt wird.

Beachten Sie, dass die doppelte exponentielle Glättung die Saisonalität immer noch nicht berücksichtigt. Für bessere exponentiell geglättete Vorhersagen mit Daten, bei denen saisonale Schwankungen erwartet werden oder bekannt sind, verwenden Sie die dreifache exponentielle Glättung.

Wie bei der einfachen exponentiellen Glättung werden auch bei der doppelten exponentiellen Glättung vergangene Beobachtungen mit zunehmendem Alter exponentiell kleiner gewichtet. Mit anderen Worten: Jüngere Beobachtungen werden bei der Vorhersage relativ stärker gewichtet als ältere Beobachtungen.

Es gibt zwei Gleichungen, die mit der doppelten exponentiellen Glättung verbunden sind:

ft =
          a.Yt+(1-a)(ft-1+bt-1)

bt = g.(ft-ft-1)+(1-g).bt-1

Dabei gilt:
  • Yt ist der beobachtete Wert zum Zeitpunkt t.
  • ft ist die Prognose zum Zeitpunkt t.
  • bt ist die geschätzte Steigung zum Zeitpunkt t.
  • a, das für Alpha steht, ist die erste Glättungskonstante, die zur Glättung der Beobachtungen verwendet wird.
  • g, das Gamma, ist die zweite Glättungskonstante, die zur Glättung des Trends verwendet wird.

Um das Modell der doppelten exponentiellen Glättung zu initialisieren, wird f1 auf Y1 und die anfängliche Steigung b1 auf die Differenz zwischen den ersten beiden Beobachtungen, d. h. Y2-Y1, gesetzt.

Dreifache exponentielle Glättung

Die dreifache exponentielle Glättung (auch als Winters-Methode bekannt) ist eine Verfeinerung des beliebten doppelt exponentiellen Glättungsmodells, fügt aber eine weitere Komponente hinzu, die jegliche Saisonalität (oder Periodizität) in den Daten berücksichtigt.

Einfache exponentielle Glättungsmodelle funktionieren am besten bei Daten, die keine Trend- oder Saisonkomponenten enthalten. Wenn die Daten im Laufe der Zeit entweder einen steigenden oder einen fallenden Trend aufweisen, neigen einfache Prognosen mit exponentieller Glättung dazu, hinter den Beobachtungen zurückzubleiben. Die doppelte exponentielle Glättung wurde für diese Art von Datenreihen entwickelt, indem jeder Trend in den Daten berücksichtigt wird. Keines dieser exponentiellen Glättungsmodelle berücksichtigt jedoch die Saisonalität in den Daten.

Für bessere exponentiell geglättete Vorhersagen von Daten, bei denen saisonale Schwankungen erwartet werden oder bekannt sind, sollte die dreifache exponentielle Glättung verwendet werden.

Wie bei der einfachen exponentiellen Glättung werden auch bei den Modellen der dreifachen exponentiellen Glättung vergangene Beobachtungen mit zunehmendem Alter exponentiell kleiner gewichtet. Mit anderen Worten: Jüngere Beobachtungen werden bei der Vorhersage relativ stärker gewichtet als ältere Beobachtungen. Dies gilt für alle beteiligten Begriffe. Nämlich das Basisniveau Lt, der Trend Tt sowie der Saisonalitätsindex st.

Es gibt vier Gleichungen, die mit der dreifachen exponentiellen Glättung verbunden sind:

Lt =
          a.(xt/st-c)+(1-a).(Lt-1+Tt-1)
Tt = b.(Lt-Lt-1)+(1-b).Tt-1
st =
          g.(xt/Lt)+(1-g).st-c

ft,k = (Lt+k.Tt).st+k-c

Dabei gilt:
  • Lt ist die Schätzung des Basiswertes zum Zeitpunkt t. Das heißt, die Schätzung für den Zeitpunkt t nach Eliminierung der Auswirkungen von Saisonalität und Trend.
  • a, das für Alpha steht, ist die erste Glättungskonstante, die zur Glättung von Lt.
  • xt ist der beobachtete Wert zum Zeitpunkt t.
  • st ist der saisonale Index zum Zeitpunkt t.
  • c ist die Anzahl der Perioden im saisonalen Muster. Zum Beispiel c=4 für vierteljährliche Daten oder c=12 für monatliche Daten.
  • Tt ist der geschätzte Trend zum Zeitpunkt t.
  • b, das Beta darstellt, ist die zweite Glättungskonstante, die zur Glättung der Trendschätzungen verwendet wird.
  • g, das für Gamma steht, ist die dritte Glättungskonstante, die zur Glättung der Schätzungen der Saisonalität verwendet wird.
  • ft,k ist die Prognose zum Zeitpunkt des Endes der Periode t für die Periode t+k.

Es gibt verschiedene Möglichkeiten, Ausgangswerte für das Modell der dreifachen exponentiellen Glättung zu ermitteln. Bei dem hier angewandten Ansatz werden die Daten der ersten beiden Jahre (oder vollständigen Zyklen) verwendet, um die Anfangswerte für Lt, Tt und st zu ermitteln. Um die besten Ergebnisse zu erzielen, werden mehr Daten empfohlen (idealerweise mindestens 4 oder 5 vollständige Zyklen). Dies gibt dem Modell die Möglichkeit, sich besser an die Daten anzupassen, anstatt sich darauf zu verlassen, gute Schätzungen für die Anfangsbedingungen zu erhalten (zu erraten).

Gleitender Durchschnitt

Ein Prognosemodell mit gleitendem Durchschnitt basiert auf einer künstlich konstruierten Zeitreihe, bei der der Wert für einen bestimmten Zeitraum durch den Mittelwert dieses Wertes und der Werte für eine bestimmte Anzahl vorhergehender und nachfolgender Zeiträume ersetzt wird. Wie Sie aus der Beschreibung vielleicht schon erraten haben, eignet sich dieses Modell am besten für Zeitreihendaten, d. h. Daten, die sich im Laufe der Zeit verändern.

Da der Prognosewert für einen bestimmten Zeitraum ein Durchschnitt der vorangegangenen Zeiträume ist, wird die Prognose immer hinter dem Anstieg oder Rückgang der beobachteten (abhängigen) Werte zurückbleiben. Wenn beispielsweise eine Datenreihe einen deutlichen Aufwärtstrend aufweist, wird eine Prognose mit gleitendem Durchschnitt in der Regel eine Unterschätzung der Werte der abhängigen Variable ergeben.

Die Methode des gleitenden Durchschnitts hat gegenüber anderen Prognosemodellen den Vorteil, dass sie Spitzen und Tiefpunkte (oder Täler) in einer Reihe von Beobachtungen glättet. Sie hat jedoch auch einige Nachteile. Insbesondere ergibt dieses Modell keine tatsächliche Gleichung. Daher ist sie als mittel- bis langfristiges Prognoseinstrument nicht sehr nützlich. Sie kann nur zuverlässig für eine oder zwei Perioden in die Zukunft vorausgesagt werden.

Das Modell des gleitenden Durchschnitts ist ein Spezialfall des allgemeineren gewichteten gleitenden Durchschnitts. Beim einfachen gleitenden Durchschnitt sind alle Gewichte gleich.