Modelos de séries temporais: a revolução silenciosa no forecasting de IA

Empresário com roupa formal e óculos trabalhando com gráficos e relatórios de mercado em telas de computador em seu escritório moderno.

Os grandes modelos de linguagem podem dominar as manchetes, mas uma classe diferente de IA pode mudar a forma como as empresas preveem o futuro. Modelos de séries temporais compactos e eficientes estão transformando o forecasting em todos os setores.

O MinyTimeMixer (TTM) da IBM exemplifica essa tendência. Com menos de um milhão de parâmetros, o TTM oferece previsões robustas sem as demandas computacionais de seus equivalentes maiores.

“A previsão pode ser uma ferramenta poderosa quando aplicada corretamente”, explica o Estrategista Técnico da IBM Joshua Noble. "A capacidade de prever demanda, receita, custos, falhas de dispositivos ou mudanças de mercado são ativos poderosos para empresas de qualquer tamanho."

O setor de IA observou recentemente um aumento de interesse em modelos de linguagem menores e mais eficientes. Esses modelos compactos visam oferecer desempenho comparável a equivalentes maiores, ao mesmo tempo em que exigem menos poder computacional e memória. Por exemplo, a Mistral IA chamou a atenção com seu modelo Mixtral 8x7B, que usa uma combinação de especialistas para obter alto desempenho com uma contagem de parâmetros relativamente pequena.

Essa tendência à “IA Lite” reflete um foco crescente na implementação prática e na acessibilidade, o que pode democratizar a tecnologia de IA para uma gama mais ampla de aplicações e dispositivos.

Atenção cercada: a chave para a eficiência

O TTM substitui a autoatenção tradicional de aprendizado de máquina — onde cada elemento em uma sequência avalia sua relação com todos os outros — pela atenção controlada, um mecanismo que controla seletivamente blocos simples de perceptron para conectar variáveis de séries temporais. Essa abordagem otimizada aprimora o foco e reduz os custos computacionais no treinamento e no ajuste fino, resultando em um modelo lean e eficiente que se destaca em tarefas de séries temporais.

O conjunto de dados de qualidade do ar de Pequim é um caso de teste do mundo real que mostra a capacidade da TTM de prever os níveis de poluição do ar do PM2.5 usando dados históricos e variáveis meteorológicas. Essa aplicação demonstra o potencial do modelo no monitoramento ambiental e no planejamento urbano.

Embora os modelos de séries temporais se mostrem promissores, os desafios permanecem. Noble adverte: "O forecasting, como a maior parte da IA, depende de bons dados e padrões previsíveis. Há alguns fenômenos que simplesmente não são muito previsíveis, e nenhum modelo será capaz de contornar isso."

O ajuste fino lida com as limitações do modelo por meio de um processo otimizado: preparar dados, carregar o modelo, avaliar, ajustar e reavaliar. Seu impacto é claro: para as previsões de qualidade do ar de Pequim, o ajuste fino reduziu a perda de avaliação de 0,426 para 0,253, melhorando significativamente a precisão da previsão. Esse exemplo do mundo real demonstra o poder do ajuste fino em melhorar o desempenho do modelo para tarefas específicas.

Ajuste fino para precisão

O processo de ajuste fino envolve a divisão do conjunto de dados, o carregamento do modelo pré-treinado, o estabelecimento do desempenho de referência, o ajuste fino dos dados de treinamento com parada antecipada e a avaliação final. Essa abordagem aprimora a capacidade do modelo de capturar padrões de dados complexos, fazendo previsões mais precisas.

O pipeline de forecasting do TTM lida com dados complexos de séries temporais, incorporando variáveis de destino e fatores externos. Voltando ao exemplo de forecasting do PM2.5, essa abordagem permite que a TTM capture relações intrincadas entre vários elementos que afetam a qualidade do ar. Ao considerar múltiplas variáveis simultaneamente, o modelo fornece previsões mais precisas e diferenciadas, levando em conta a complexa interação de fatores que influenciam a qualidade do ar ao longo do tempo.

A plataforma IBM watsonx leva esses recursos a uma audiência mais ampla. A plataforma permite que os usuários treinam, validam, ajustam e implementam modelos de forma eficiente, democratizando a previsão orientada por IA para empresas de todos os tamanhos.

À medida que modelos de séries temporais como o TTM evoluem, seu impacto no forecasting aumenta. Esses modelos oferecem ferramentas poderosas para navegar pela incerteza, desde a otimização da cadeia de suprimentos até a previsão de tendências de mercado.

Noble resume o potencial desses modelos: "Modelos de base treinados em dados de séries temporais podem ajudar a reduzir a barreira de entrada para esse tipo de forecasting, porque eles têm grande parte dos dados de treinamento já integrados".

 

Autora

Sascha Brodsky

Staff Writer

IBM

Vista de cima de um empresário mestiço usando um telefone celular no pátio de um escritório

Insights que você não pode perder. Inscreva-se em nossos boletins informativos.

Vá além da euforia com notícias de especialistas sobre IA, computação quântica, nuvem, segurança e muito mais.

Assine hoje