Os grandes modelos de linguagem podem dominar as manchetes, mas uma classe diferente de IA pode mudar a forma como as empresas preveem o futuro. Modelos de séries temporais compactos e eficientes estão transformando o forecasting em todos os setores.
O MinyTimeMixer (TTM) da IBM exemplifica essa tendência. Com menos de um milhão de parâmetros, o TTM oferece previsões robustas sem as demandas computacionais de seus equivalentes maiores.
“A previsão pode ser uma ferramenta poderosa quando aplicada corretamente”, explica o Estrategista Técnico da IBM Joshua Noble. "A capacidade de prever demanda, receita, custos, falhas de dispositivos ou mudanças de mercado são ativos poderosos para empresas de qualquer tamanho."
O setor de IA observou recentemente um aumento de interesse em modelos de linguagem menores e mais eficientes. Esses modelos compactos visam oferecer desempenho comparável a equivalentes maiores, ao mesmo tempo em que exigem menos poder computacional e memória. Por exemplo, a Mistral IA chamou a atenção com seu modelo Mixtral 8x7B, que usa uma combinação de especialistas para obter alto desempenho com uma contagem de parâmetros relativamente pequena.
Essa tendência à “IA Lite” reflete um foco crescente na implementação prática e na acessibilidade, o que pode democratizar a tecnologia de IA para uma gama mais ampla de aplicações e dispositivos.
O TTM substitui a autoatenção tradicional de aprendizado de máquina — onde cada elemento em uma sequência avalia sua relação com todos os outros — pela atenção controlada, um mecanismo que controla seletivamente blocos simples de perceptron para conectar variáveis de séries temporais. Essa abordagem otimizada aprimora o foco e reduz os custos computacionais no treinamento e no ajuste fino, resultando em um modelo lean e eficiente que se destaca em tarefas de séries temporais.
O conjunto de dados de qualidade do ar de Pequim é um caso de teste do mundo real que mostra a capacidade da TTM de prever os níveis de poluição do ar do PM2.5 usando dados históricos e variáveis meteorológicas. Essa aplicação demonstra o potencial do modelo no monitoramento ambiental e no planejamento urbano.
Embora os modelos de séries temporais se mostrem promissores, os desafios permanecem. Noble adverte: "O forecasting, como a maior parte da IA, depende de bons dados e padrões previsíveis. Há alguns fenômenos que simplesmente não são muito previsíveis, e nenhum modelo será capaz de contornar isso."
O ajuste fino lida com as limitações do modelo por meio de um processo otimizado: preparar dados, carregar o modelo, avaliar, ajustar e reavaliar. Seu impacto é claro: para as previsões de qualidade do ar de Pequim, o ajuste fino reduziu a perda de avaliação de 0,426 para 0,253, melhorando significativamente a precisão da previsão. Esse exemplo do mundo real demonstra o poder do ajuste fino em melhorar o desempenho do modelo para tarefas específicas.
O processo de ajuste fino envolve a divisão do conjunto de dados, o carregamento do modelo pré-treinado, o estabelecimento do desempenho de referência, o ajuste fino dos dados de treinamento com parada antecipada e a avaliação final. Essa abordagem aprimora a capacidade do modelo de capturar padrões de dados complexos, fazendo previsões mais precisas.
O pipeline de forecasting do TTM lida com dados complexos de séries temporais, incorporando variáveis de destino e fatores externos. Voltando ao exemplo de forecasting do PM2.5, essa abordagem permite que a TTM capture relações intrincadas entre vários elementos que afetam a qualidade do ar. Ao considerar múltiplas variáveis simultaneamente, o modelo fornece previsões mais precisas e diferenciadas, levando em conta a complexa interação de fatores que influenciam a qualidade do ar ao longo do tempo.
A plataforma IBM watsonx leva esses recursos a uma audiência mais ampla. A plataforma permite que os usuários treinam, validam, ajustam e implementam modelos de forma eficiente, democratizando a previsão orientada por IA para empresas de todos os tamanhos.
À medida que modelos de séries temporais como o TTM evoluem, seu impacto no forecasting aumenta. Esses modelos oferecem ferramentas poderosas para navegar pela incerteza, desde a otimização da cadeia de suprimentos até a previsão de tendências de mercado.
Noble resume o potencial desses modelos: "Modelos de base treinados em dados de séries temporais podem ajudar a reduzir a barreira de entrada para esse tipo de forecasting, porque eles têm grande parte dos dados de treinamento já integrados".