I modelli linguistici di grandi dimensioni possono dominare i titoli dei giornali, ma una classe diversa di AI potrebbe cambiare il modo in cui le aziende prevedono il futuro. I modelli di serie temporali, compatti ed efficienti, stanno trasformando le previsioni in tutti i settori.
TinyTimeMixer (TTM) di IBM® esemplifica questa tendenza. Con meno di un milione di parametri, TTM fornisce previsioni affidabili senza le esigenze di calcolo delle sue controparti più grandi.
"Se applicata correttamente, la previsione può rivelarsi uno strumento potente", spiega Joshua Noble, Technical Strategist di IBM. "La capacità di prevedere la domanda, i ricavi, i costi, i guasti dei dispositivi o i cambiamenti del mercato sono tutti asset potenti per un'azienda di qualsiasi dimensione".
L'industria dell'AI ha recentemente visto un aumento dell'interesse per modelli linguistici più piccoli ed efficienti. Questi modelli compatti mirano a offrire prestazioni paragonabili a quelle di modelli più grandi, richiedendo però meno potenza di calcolo e memoria. Ad esempio, Mistral AI ha attirato l'attenzione con il suo modello Mixtral 8x7B, che utilizza un approccio Mixture of Experts per ottenere alte prestazioni con un numero di parametri relativamente ridotto.
Questa tendenza verso l'"AI lite" riflette una crescente attenzione all'implementazione pratica e all'accessibilità, potenzialmente democratizzando la tecnologia AI per una più ampia gamma di applicazioni e dispositivi.
TTM sostituisce l'autoattenzione tradizionale del machine learning, dove ogni elemento di una sequenza valuta la sua relazione con tutti gli altri, con l'attenzione isolata, un meccanismo che controlla selettivamente semplici blocchi di percettroni per collegare variabili di serie temporali. Questo approccio semplificato aumenta la concentrazione e riduce drasticamente i costi computazionali nella formazione e nella messa a punto, dando vita a un modello snello ed efficiente che eccelle nelle attività di serie temporali.
Il set di dati sulla qualità dell'aria di Pechino è un caso di test reale che mostra la capacità di TTM di predire i livelli di inquinamento atmosferico da PM2,5 utilizzando dati storici e variabili meteorologiche. Questa applicazione dimostra il potenziale del modello nel monitoraggio ambientale e nella pianificazione urbana.
Sebbene i modelli di serie temporali siano promettenti, rimangono delle sfide da affrontare. Noble avverte: "La previsione, come la maggior parte delle AI, si basa su dati affidabili e schemi prevedibili. Ci sono alcuni fenomeni che semplicemente non sono molto prevedibili e nessun modello sarà in grado di risolvere il problema".
La messa a punto affronta le limitazioni del modello attraverso un processo semplificato: preparare i dati, caricare il modello, valutare, ottimizzare e rivalutare. Il suo impatto è evidente: per le previsioni sulla qualità dell'aria a Pechino, la messa a punto ha ridotto la perdita di valutazione da 0,426 a 0,253, migliorando significativamente l'accuratezza delle previsioni. Questo esempio reale dimostra il potere della messa a punto nel migliorare le prestazioni del modello per compiti specifici.
Il processo di messa a punto prevede la suddivisione del set di dati, il caricamento del modello pre-addestrato, la definizione delle prestazioni di base, la messa a punto dei dati di addestramento con interruzione anticipata e la valutazione finale. Questo approccio migliora la capacità del modello di catturare modelli di dati complessi, ottenendo previsioni più accurate.
La pipeline di previsione di TTM gestisce dati di serie temporali complesse, incorporando sia variabili target che fattori esterni. Tornando all'esempio di previsione delle PM2,5, questo approccio permette a TTM di catturare relazioni complesse tra vari elementi che influenzano la qualità dell'aria. Considerando contemporaneamente più variabili, il modello fornisce previsioni più accurate e fini, tenendo conto della complessa interazione di fattori che influenzano la qualità dell'aria nel tempo.
La piattaforma IBM watsonx mette queste funzionalità a disposizione di un pubblico più ampio. La piattaforma consente agli utenti di addestrare, convalidare, adattare e distribuire modelli in modo efficiente, democratizzando la previsione basata sull'AI per aziende di tutte le dimensioni.
Man mano che i modelli di serie temporali come TTM si evolvono, il loro impatto sulla previsione aziendale cresce. Questi modelli offrono strumenti potenti per affrontare l'incertezza, dall'ottimizzazione della supply chain alla previsione delle tendenze di mercato.
Noble riassume il potenziale di questi modelli: "I modelli di base addestrati su dati di serie temporali possono contribuire ad abbassare l'asticella di ingresso per questo tipo di previsione perché hanno molti dei dati di addestramento già integrati".