Qué es un modelo autorregresivo

Autores

Data Scientist

¿Qué es un modelo autorregresivo?

El modelado autorregresivo es una técnica de machine learning más comúnmente utilizada para el análisis y la previsión que utiliza uno o más valores de pasos de tiempo anteriores en una serie de tiempo para crear una regresión.

Es una técnica simple pero poderosa para el análisis de seriales temporales que proporciona predicciones altamente interpretables y efectivas si sus datos contienen correlaciones entre los pasos de tiempo. La correlación entre pasos de tiempo se denomina autocorrelación porque es una medida de cuánto se correlaciona un valor consigo mismo. Un proceso puramente lineal se autocorrelacionará perfectamente consigo mismo a lo largo del serial temporal, lo que permitirá predecir el siguiente valor exactamente a partir de valores anteriores mediante un proceso autorregresivo. Un proceso completamente estocástico, como el ruido blanco, no tendrá autocorrelación, ya que no podemos predecir los valores actuales o futuros empleando los valores pasados.

Un serial temporal es una secuencia de mediciones de la misma variable o grupo de variables realizadas a lo largo del tiempo. Las mediciones suelen realizar a intervalos regulares, por ejemplo, cada hora, mes o año. Por ejemplo, podríamos tener valores que midan el número de pasajeros de aerolíneas en un país, con mediciones observadas cada mes. En este caso, y representa los recuentos de pasajeros medidos y enfatiza la existencia de valores medidos a lo largo del tiempo. El valor de t se aplica como un subíndice en lugar de la i habitual para indicar que y_t representa el valor de y en cualquier momento.

Un modelo autorregresivo es cuando hacemos una regresión de un valor de un serial de tiempo sobre valores anteriores de ese mismo serial de tiempo. Por ejemplo, y_t regresionado en y_t-1 emplea el valor anterior de y, llamado valor rezagado, para predecir el valor actual de y. En este modelo de regression simple, la variable dependiente en el periodo de tiempo anterior se convirtió en el predictor. Los errores representan todas las suposiciones habituales sobre los errores en un modelo de regression lineal simple. A menudo consideramos el orden de una autorregresión como el número de valores anteriores en el serial empleado para predecir el valor actual. Por lo tanto, y_t regresionado en y_t-1 es una autorregresión de primer orden, que se escribe como AR(1).

Definiciones de autorregresión

En una regresión lineal múltiple, el resultado de la regresión es una combinación lineal de múltiples variables de entrada. En los modelos de autorregresión, el resultado es el punto de datos futuro expresado como una combinación lineal de los puntos de datos p anteriores. p es el número de rezagos incluidos en la ecuación. Un modelo AR(1) se define matemáticamente como:

$x_{t} = δ + ϕ_{1} x_{t - 1} + α_{t}$

x_t-1 es el valor del serial pasado de un retraso

ϕ es el coeficiente calculado para ese retraso

Alpha_t es ruido blanco (como aleatoriedad)

Delta se define como

$δ = (1 - \sum_{p}^{i = 1} ϕ_{i}) μ$

para un modelo autorregresivo de orden p, donde p es el número total de covariables calculadas para los retrasos y μ es la media del proceso.

Cuando se agregan más retrasos al modelo, agregamos más coeficientes y variables de retraso a la ecuación:

$x_{t} = δ + ϕ_{1} x_{t - 1} + ϕ_{2} x_{t - 2} + α_{t}$

El modelo anterior es una autoregresión de segundo orden, ya que contiene dos retardos.

La forma general de una ecuación autorregresiva para un orden p es

$x_{t} = δ + ϕ_{1} x_{t - 1} . . . ϕ_{p} x_{t - p} + α_{t}$

Para utilizar modelos autorregresivos para el forecasting de series de tiempo utilizamos el valor de tiempo actual y cualquier dato histórico para predecir el siguiente paso de tiempo. Por ejemplo, un modelo AR con 2 rezagos podría predecir un solo paso adelante de la siguiente manera:

$x_{t + 1} = δ + ϕ_{1} x_{t} + ϕ_{2} x_{t - 1} + α_{t + 1}$

Estimación de coeficientes

Los métodos más habituales para calcular los coeficientes de cada retardo son la estimación de máxima verosimilitud (MLE) o la estimación por mínimos cuadrados (OLS). Las mismas limitaciones que tienen estos enfoques cuando se ajusta una regression de un modelo lineal están presentes también cuando se ajustan modelos autorregresivos. Dependiendo de si está empleando Python o R y la biblioteca, es posible que pueda emplear los métodos de Yule-Walker o Burg, además de MLE u OLS.

Muchas bibliotecas permiten a los usuarios seleccionar qué criterios emplear al seleccionar modelos de todos los modelos candidatos. Por ejemplo, quizá desee usar el modelo de coeficientes del modelo para minimizar el criterio de información de Akaike o los criterios de información bayesianos, dependiendo de su caso de uso y los datos disponibles.

Seleccionar el orden de un modelo AR

La autocorrelación calcula la correlación entre un serial temporal y una versión rezagada de sí misma. El rezago es el número de unidades de tiempo para desplazar el serial temporal. Un retraso de 1 compara el serial con un paso de tiempo anterior. Un retraso de 2 lo compara con el paso de tiempo anterior a ese. El grado de autocorrelación en un rezago particular muestra la dependencia temporal de los datos. Cuando la autocorrelación es alta, existe una fuerte relación entre el valor actual y el valor en ese rezago. Cuando la autocorrelación es baja o cercana a cero, sugiere una relación débil o ninguna relación en absoluto.

Una forma común para visualizar la autocorrelación es calcular la ACF o el gráfico de ACF que muestra los coeficientes de autocorrelación en diferentes rezagos.

El eje horizontal representa el rezago y el eje vertical, los valores de autocorrelación. Los picos o patrones importante en el gráfico de ACF pueden revelar la estructura temporal subyacente de los datos. La selección del orden de rezago (p) en el modelo AR a menudo se basa en el análisis del gráfico de ACF. En un modelo AR(p), el valor actual de la serie temporal se expresa como una combinación lineal de sus valores p anteriores, donde los coeficientes se determinan a través de mínimos cuadrados ordinarios (OLS, sigla en inglés de minimum least squares) o de la estimación por máxima verosimilitud (MLE, sigla en inglés de maximum likelihood estimation). La autocorrelación también se emplea para evaluar si una serie temporal es estacionaria. En el caso de una serie temporal estacionaria, la autocorrelación debería disminuir gradualmente a medida que aumente el rezago, pero si el gráfico de ACF no indica una disminución, es posible que los datos muestren no estacionariedad. Puede obtener más información sobre autocorrelación aquí.

Las últimas noticias tecnológicas, respaldadas por los insights de expertos

Manténgase al día sobre las tendencias más importantes e intrigantes de la industria sobre IA, automatización, datos y más con el boletín Think. Consulte la Declaración de privacidad de IBM.

Variantes de modelos autorregresivos

Existen muchas variaciones diferentes del modelo estándar de series temporales autorregresivas que abordan sus desafíos y deficiencias.

Modelos vectoriales autorregresivos

Un modelo estadístico autorregresivo simple funciona con conjuntos de datos univariados, lo que significa que un conjunto de datos debe contener un valor para cada periodo. Se desarrollaron modelos vectoriales autorregresivos (VAR) para permitir autorregresiones de seriales temporales multivariantes. Están estructurados de manera que cada variable es una función lineal de los rezagos pasados de sí misma y de los rezagos pasados de las otras variables. Imagine que tiene un serial temporal que consta de dos mediciones diferentes, el número mensual de vuelos en avión y el número mensual de viajes interurbanos en tren. En un modelo VAR, puede predecir el valor de usar ambos con una regression para cada uno que incluya el otro valor. Codificando los viajes en tren como X_r y los viajes en avión como X_a tendríamos:

$x_{t, r} = α_{r} + ϕ_{11} x_{t - 1, a} + ϕ_{12} x_{t - 1, r} + ϵ_{t, r}$

$x_{t, a} = α_{a} + ϕ_{11} x_{t - 1, a} + ϕ_{12} x_{t - 1, r} + ϵ_{t, a}$

ARMA y ARIMA

Los modelos autorregresivos simples pueden tener dificultades con series temporales que tengan una tendencia marcada. Dos variaciones populares del modelo autorregresivo son el modelo autorregresivo de media móvil (ARMA) y el modelo autorregresivo integrado de media móvil (ARIMA). Estas variaciones son especialmente útiles cuando los datos tienen una tendencia marcada. El modelado de la media móvil es otro enfoque para pronosticar datos de series temporales y ARIMA integra estos dos enfoques, de ahí el nombre. También existen variaciones de los modelos ARIMA. Una de las extensiones más comunes es el vector ARIMA (VARIMA), empleado cuando los datos son multivariados. Otra extensión común es ARIMA estacional (SARIMA) cuando los datos muestran una marcada estacionalidad. Puede leer más sobre los modelos ARIMA aquí.

Heterocedasticidad condicional autorregresiva

Los modelos autorregresivos funcionan de manera mucho más confiable cuando los datos del serial temporal son estacionarios y la varianza a lo largo del serial temporal no varía. A menudo, los datos no estacionarios se diferencian en el tiempo para eliminar los cambios en la varianza y luego ajustar un modelo AR. A veces, esa variación es significativa y un científico de datos quiere dejarla. El método de heteroscedasticidad condicional autorregresiva (ARCH) proporciona una manera de modelar un cambio en la varianza en una serie temporal que es dependiente del tiempo, como aumentar o disminuir la volatilidad. Una extensión de este enfoque, conocido como heteroscedasticidad condicional autorregresiva generalizada (GARCH), permite que el método soporte cambios en la volatilidad dependiente del tiempo. Por ejemplo, aumentar y disminuir la volatilidad en el mismo serial.

Cuando existe un proceso no estocástico a los cambios en las varianzas de series de tiempo, la heteroscedasticidad condicional autorregresiva o el algoritmo ARCH pueden utilizar técnicas autorregresivas para modelar y predecir cambios en la volatilidad de los conjuntos de datos. Los modelos autorregresivos regulares no modelan un cambio en la varianza a lo largo de un conjunto de datos. Debido a esto, un científico de datos podría usar una transformación de box-cox para reducir la varianza en el conjunto de datos. Sin embargo, si el cambio en la varianza está autocorrelacionado, entonces un enfoque ARCH para el modelado puede proporcionar predicciones sobre cuándo podría comenzar a cambiar un proceso. Este enfoque se conoce como forecasting de volatilidad y se utiliza comúnmente en econometría y análisis financiero. Por ejemplo, cuando se trabaja con datos de precios de acciones, el interés podría expandirse más allá de modelar los precios potenciales hasta forecasting cuándo comienza a cambiar drásticamente.

Mixture of Experts | 12 de diciembre, episodio 85

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

Vea todos los episodios de Mixture of Experts

Otras aplicaciones de la autorregresión

Aunque los modelos autorregresivos se asocian comúnmente con datos de seriales temporales, son posibles otras aplicaciones de modelado con diferentes tipos de datos.

Procesamiento de lenguaje natural

Las técnicas de modelado autorregresivo generan la probabilidad de secuencias de tokens, por ejemplo, para sugerir una posible siguiente letra o palabra en un texto predictivo. Los modelos de lenguaje autorregresivos calculan la probabilidad de cada token posible dados los tokens anteriores en la cadena. Dada la cadena "el mouse se comió el", un modelo que vio un número razonable de oraciones en inglés probablemente asignaría una mayor probabilidad a "cheese" que a "homework". Esta probabilidad se asigna a través de un proceso autorregresivo que emplea todos los tokens anteriores de la cadena para asignar probabilidades a cada token en el modelo de lenguaje.

Datos espaciales

Una aplicación diferente de los principios autorregresivos es emplear las ubicaciones de los valores como una secuencia y hacer una regresión de todas las ubicaciones relevantes en la ubicación de interés. Por ejemplo, podríamos sospechar que la distancia de una fábrica afecta las lecturas de calidad del aire. Un modelo autorregresivo emplearía las lecturas de otros sitios como valores retrasados y la distancia desde la fábrica como retrasos.

Cuatro pasos para mejorar el forecasting empresarial con analytics

Utilice el poder de los analytics y la business intelligence para planificar, pronosticar y dar forma a los resultados futuros que mejor beneficien a su empresa y a sus clientes.

¿Qué es un modelo autorregresivo?