En una regresión lineal múltiple, el resultado de la regresión es una combinación lineal de múltiples variables de entrada. En los modelos de autorregresión, el resultado es el punto de datos futuro expresado como una combinación lineal de los puntos de datos p anteriores. p es el número de rezagos incluidos en la ecuación. Un modelo AR(1) se define matemáticamente como:
xt-1 es el valor del serial pasado de un retraso
ϕ es el coeficiente calculado para ese retraso
Alphat es ruido blanco (como aleatoriedad)
Delta se define como
para un modelo autorregresivo de orden p, donde p es el número total de covariables calculadas para los retrasos y μ es la media del proceso.
Cuando se agregan más retrasos al modelo, agregamos más coeficientes y variables de retraso a la ecuación:
El modelo anterior es una autoregresión de segundo orden, ya que contiene dos retardos.
La forma general de una ecuación autorregresiva para un orden p es
Para utilizar modelos autorregresivos para el forecasting de series de tiempo utilizamos el valor de tiempo actual y cualquier dato histórico para predecir el siguiente paso de tiempo. Por ejemplo, un modelo AR con 2 rezagos podría predecir un solo paso adelante de la siguiente manera: