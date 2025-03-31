Mentre modelli di ragionamento come o1 di OpenAI, DeepSeek-R1 e Gemini 2.5 di Google competono per i migliori benchmark, le aziende che vogliono integrare l'AI stanno diventando sempre più caute verso ciò che si chiama "bloating del modello", il fenomeno per cui i modelli diventano inutilmente grandi o complessi, aumentando i costi computazionali e i tempi di addestramento dei modelli e riducendo la velocità con cui possono fornire le risposte di cui le aziende hanno bisogno.

O1 e DeepSeek-R1 di OpenAI utilizzano il ragionamento della chain of thought (CoT) per suddividere problemi complessi in fasi, raggiungendo prestazioni senza precedenti e maggiore accuratezza rispetto ai modelli precedenti. Ma la CoT richiede anche risorse sostanziali durante l'inferenza, portando a output lunghi e una latenza ad alta, afferma Volkmar Uhlig, un VP e AI Infrastructure Portfolio Lead presso IBM, in un'intervista con IBM Think.

Ed è qui che entra in scena una nuova classe di tecniche di prompting, descritte in vari nuovi articoli, che vanno dall'atomo di pensiero (AoT) alla catena di draft (CoD), che mirano ad aumentare l'efficienza e la precisione di CoT aiutando i modelli a risolvere problemi più rapidamente, riducendo così costi e latenza.

L'AI scientist e fondatore della startup Lance Elliott vede le nuove diramazioni della chain of thought come variazioni nel toolkit di un ingegnere di prompt. "Il tipico toolkit per il fai da te domestico potrebbe includere un martello normale, che sarebbe CoT", spiega a IBM Think. "L'AoT sarebbe come usare un martello specializzato per situazioni che comportano il taglio e la regolazione del cartongesso. Per i lavori sul cartongesso potresti usare un martello normale, ma se avessi un martello per cartongesso e lo sapessi usare correttamente sarebbe meglio."

Vyoma Gajjar, AI Technical Solution Architect presso IBM, vede potenziale in questi nuovi cugini di CoT, soprattutto per le aziende "che cercano modi più economici per spingere i piccoli modelli a ottenere risposte accurate per i loro casi d'uso specifici", afferma.