¿Qué es un modelo autorregresivo?

Un hombre mira una tableta digital que un colega está mostrando en el trabajo

Autores

Joshua Noble

Data Scientist

El modelado autorregresivo es una técnica de machine learning más comúnmente utilizada para el análisis y la previsión que utiliza uno o más valores de pasos de tiempo anteriores en una serie de tiempo para crear una regresión.

Es una técnica simple pero poderosa para el análisis de seriales temporales que proporciona predicciones altamente interpretables y efectivas si sus datos contienen correlaciones entre los pasos de tiempo. La correlación entre pasos de tiempo se denomina autocorrelación porque es una medida de cuánto se correlaciona un valor consigo mismo. Un proceso puramente lineal se autocorrelacionará perfectamente consigo mismo a lo largo del serial temporal, lo que permitirá predecir el siguiente valor exactamente a partir de valores anteriores mediante un proceso autorregresivo. Un proceso completamente estocástico, como el ruido blanco, no tendrá autocorrelación, ya que no podemos predecir los valores actuales o futuros empleando los valores pasados.

Un serial temporal es una secuencia de mediciones de la misma variable o grupo de variables realizadas a lo largo del tiempo. Las mediciones suelen realizar a intervalos regulares, por ejemplo, cada hora, mes o año. Por ejemplo, podríamos tener valores que midan el número de pasajeros de aerolíneas en un país, con mediciones observadas cada mes. En este caso, y representa los recuentos de pasajeros medidos y enfatiza la existencia de valores medidos a lo largo del tiempo. El valor de t se aplica como un subíndice en lugar de la i habitual para indicar que yt representa el valor de y en cualquier momento.

Un modelo autorregresivo es cuando hacemos una regresión de un valor de un serial de tiempo sobre valores anteriores de ese mismo serial de tiempo. Por ejemplo, yt regresionado en yt-1 emplea el valor anterior de y, llamado valor rezagado, para predecir el valor actual de y. En este modelo de regression simple, la variable dependiente en el periodo de tiempo anterior se convirtió en el predictor. Los errores representan todas las suposiciones habituales sobre los errores en un modelo de regression lineal simple. A menudo consideramos el orden de una autorregresión como el número de valores anteriores en el serial empleado para predecir el valor actual. Por lo tanto, yt regresionado en yt-1 es una autorregresión de primer orden, que se escribe como AR(1).

Definiciones de autorregresión

En una regresión lineal múltiple, el resultado de la regresión es una combinación lineal de múltiples variables de entrada. En los modelos de autorregresión, el resultado es el punto de datos futuro expresado como una combinación lineal de los puntos de datos p anteriores. p es el número de rezagos incluidos en la ecuación. Un modelo AR(1) se define matemáticamente como:

 Xt=δ+ϕ1Xt-1+αt

xt-1 es el valor del serial pasado de un retraso

ϕ es el coeficiente calculado para ese retraso

Alphat es ruido blanco (como aleatoriedad)

Delta se define como

 δ=(1-pi=1ϕi)μ

para un modelo autorregresivo de orden p, donde p es el número total de covariables calculadas para los retrasos y μ es la media del proceso.

Cuando se agregan más retrasos al modelo, agregamos más coeficientes y variables de retraso a la ecuación:

 Xt=δ+ϕ1Xt-1+ϕ2Xt-2+αt

El modelo anterior es una autoregresión de segundo orden, ya que contiene dos retardos.

La forma general de una ecuación autorregresiva para un orden p es

 Xt=δ+ϕ1Xt-1...ϕpXt-p+αt

Para utilizar modelos autorregresivos para el forecasting de series de tiempo utilizamos el valor de tiempo actual y cualquier dato histórico para predecir el siguiente paso de tiempo. Por ejemplo, un modelo AR con 2 rezagos podría predecir un solo paso adelante de la siguiente manera:

 Xt+1=δ+ϕ1Xt+ϕ2Xt-1+αt+1

Estimación de coeficientes

Los métodos más habituales para calcular los coeficientes de cada retardo son la estimación de máxima verosimilitud (MLE) o la estimación por mínimos cuadrados (OLS). Las mismas limitaciones que tienen estos enfoques cuando se ajusta una regression de un modelo lineal están presentes también cuando se ajustan modelos autorregresivos. Dependiendo de si está empleando Python o R y la biblioteca, es posible que pueda emplear los métodos de Yule-Walker o Burg, además de MLE u OLS.

Muchas bibliotecas permiten a los usuarios seleccionar qué criterios emplear al seleccionar modelos de todos los modelos candidatos. Por ejemplo, quizá desee usar el modelo de coeficientes del modelo para minimizar el criterio de información de Akaike o los criterios de información bayesianos, dependiendo de su caso de uso y los datos disponibles.

Seleccionar el orden de un modelo AR

La autocorrelación calcula la correlación entre un serial temporal y una versión rezagada de sí misma. El rezago es el número de unidades de tiempo para desplazar el serial temporal. Un retraso de 1 compara el serial con un paso de tiempo anterior. Un retraso de 2 lo compara con el paso de tiempo anterior a ese. El grado de autocorrelación en un rezago particular muestra la dependencia temporal de los datos. Cuando la autocorrelación es alta, existe una fuerte relación entre el valor actual y el valor en ese rezago. Cuando la autocorrelación es baja o cercana a cero, sugiere una relación débil o ninguna relación en absoluto.

Una forma común para visualizar la autocorrelación es calcular la ACF o el gráfico de ACF que muestra los coeficientes de autocorrelación en diferentes rezagos.

El eje horizontal representa el rezago y el eje vertical, los valores de autocorrelación. Los picos o patrones importante en el gráfico de ACF pueden revelar la estructura temporal subyacente de los datos. La selección del orden de rezago (p) en el modelo AR a menudo se basa en el análisis del gráfico de ACF. En un modelo AR(p), el valor actual de la serie temporal se expresa como una combinación lineal de sus valores p anteriores, donde los coeficientes se determinan a través de mínimos cuadrados ordinarios (OLS, sigla en inglés de minimum least squares) o de la estimación por máxima verosimilitud (MLE, sigla en inglés de maximum likelihood estimation). La autocorrelación también se emplea para evaluar si una serie temporal es estacionaria. En el caso de una serie temporal estacionaria, la autocorrelación debería disminuir gradualmente a medida que aumente el rezago, pero si el gráfico de ACF no indica una disminución, es posible que los datos muestren no estacionariedad. Puede obtener más información sobre autocorrelación aquí.

Diseño 3D de pelotas rodando en una pista

Las últimas novedades e insights sobre IA

Descubra insights y noticias de expertos sobre IA, la nube y mucho más en el boletín semanal Think. 

Variantes de modelos autorregresivos

Existen muchas variaciones diferentes del modelo estándar de series temporales autorregresivas que abordan sus desafíos y deficiencias.

Modelos vectoriales autorregresivos

Un modelo estadístico autorregresivo simple funciona con conjuntos de datos univariados, lo que significa que un conjunto de datos debe contener un valor para cada periodo. Se desarrollaron modelos vectoriales autorregresivos (VAR) para permitir autorregresiones de seriales temporales multivariantes. Están estructurados de manera que cada variable es una función lineal de los rezagos pasados de sí misma y de los rezagos pasados de las otras variables. Imagine que tiene un serial temporal que consta de dos mediciones diferentes, el número mensual de vuelos en avión y el número mensual de viajes interurbanos en tren. En un modelo VAR, puede predecir el valor de usar ambos con una regression para cada uno que incluya el otro valor. Codificando los viajes en tren como Xr y los viajes en avión como Xa tendríamos:

 Xt,r=αr+ϕ11Xt-1,a+ϕ12Xt-1,r+ϵt,r 

 Xt,a=αa+ϕ11Xt-1,a+ϕ12Xt-1,r+ϵt,a 

ARMA y ARIMA

Los modelos autorregresivos simples pueden tener dificultades con series temporales que tengan una tendencia marcada. Dos variaciones populares del modelo autorregresivo son el modelo autorregresivo de media móvil (ARMA) y el modelo autorregresivo integrado de media móvil (ARIMA). Estas variaciones son especialmente útiles cuando los datos tienen una tendencia marcada. El modelado de la media móvil es otro enfoque para pronosticar datos de series temporales y ARIMA integra estos dos enfoques, de ahí el nombre. También existen variaciones de los modelos ARIMA. Una de las extensiones más comunes es el vector ARIMA (VARIMA), empleado cuando los datos son multivariados. Otra extensión común es ARIMA estacional (SARIMA) cuando los datos muestran una marcada estacionalidad. Puede leer más sobre los modelos ARIMA aquí.

Heterocedasticidad condicional autorregresiva

Los modelos autorregresivos funcionan de manera mucho más confiable cuando los datos del serial temporal son estacionarios y la varianza a lo largo del serial temporal no varía. A menudo, los datos no estacionarios se diferencian en el tiempo para eliminar los cambios en la varianza y luego ajustar un modelo AR. A veces, esa variación es significativa y un científico de datos quiere dejarla. El método de heteroscedasticidad condicional autorregresiva (ARCH) proporciona una manera de modelar un cambio en la varianza en una serie temporal que es dependiente del tiempo, como aumentar o disminuir la volatilidad. Una extensión de este enfoque, conocido como heteroscedasticidad condicional autorregresiva generalizada (GARCH), permite que el método soporte cambios en la volatilidad dependiente del tiempo. Por ejemplo, aumentar y disminuir la volatilidad en el mismo serial.

Cuando existe un proceso no estocástico a los cambios en las varianzas de series de tiempo, la heteroscedasticidad condicional autorregresiva o el algoritmo ARCH pueden utilizar técnicas autorregresivas para modelar y predecir cambios en la volatilidad de los conjuntos de datos. Los modelos autorregresivos regulares no modelan un cambio en la varianza a lo largo de un conjunto de datos. Debido a esto, un científico de datos podría usar una transformación de box-cox para reducir la varianza en el conjunto de datos. Sin embargo, si el cambio en la varianza está autocorrelacionado, entonces un enfoque ARCH para el modelado puede proporcionar predicciones sobre cuándo podría comenzar a cambiar un proceso. Este enfoque se conoce como forecasting de volatilidad y se utiliza comúnmente en econometría y análisis financiero. Por ejemplo, cuando se trabaja con datos de precios de acciones, el interés podría expandirse más allá de modelar los precios potenciales hasta forecasting cuándo comienza a cambiar drásticamente.

Mixture of Experts | 28 de agosto, episodio 70

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

Otras aplicaciones de la autorregresión

Aunque los modelos autorregresivos se asocian comúnmente con datos de seriales temporales, son posibles otras aplicaciones de modelado con diferentes tipos de datos.

Procesamiento del lenguaje natural

Las técnicas de modelado autorregresivo generan la probabilidad de secuencias de tokens, por ejemplo, para sugerir una posible siguiente letra o palabra en un texto predictivo. Los modelos de lenguaje autorregresivos calculan la probabilidad de cada token posible dados los tokens anteriores en la cadena. Dada la cadena "el mouse se comió el", un modelo que vio un número razonable de oraciones en inglés probablemente asignaría una mayor probabilidad a "cheese" que a "homework". Esta probabilidad se asigna a través de un proceso autorregresivo que emplea todos los tokens anteriores de la cadena para asignar probabilidades a cada token en el modelo de lenguaje.

Datos espaciales

Una aplicación diferente de los principios autorregresivos es emplear las ubicaciones de los valores como una secuencia y hacer una regresión de todas las ubicaciones relevantes en la ubicación de interés. Por ejemplo, podríamos sospechar que la distancia de una fábrica afecta las lecturas de calidad del aire. Un modelo autorregresivo emplearía las lecturas de otros sitios como valores retrasados y la distancia desde la fábrica como retrasos.

Soluciones relacionadas
Herramientas y soluciones de analytics

Con el fin de prosperar, las empresas deben utilizar los datos para fidelizar a sus clientes, automatizar los procesos empresariales e innovar con soluciones impulsadas por IA.

Explorar las soluciones de analytics
Servicios de consultoría en datos y analytics

Desbloquee el valor de los datos empresariales con IBM Consulting y cree una organización impulsada por insights que ofrezca ventajas empresariales.

Descubra los servicios de analytics
IBM Cognos Analytics

Presentamos Cognos Analytics 12.0: insights impulsados por IA para una mejor toma de decisiones.

Explorar Cognos Analytics
Dé el siguiente paso

Con el fin de prosperar, las empresas deben utilizar los datos para fidelizar a sus clientes, automatizar los procesos empresariales e innovar con soluciones impulsadas por IA.

Explorar las soluciones de analytics Descubra los servicios de analytics