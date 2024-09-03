Nessuna tecnologia nella storia umana ha suscitato tanto interesse in così poco tempo come l'AI generativa (gen AI). Molte importanti aziende tecnologiche stanno investendo miliardi di dollari nella formazione di modelli linguistici di grandi dimensioni (LLM). Ma questa tecnologia può giustificare l'investimento? Riuscirà davvero a essere all'altezza delle aspettative?
Nella primavera del 2023, un periodo piuttosto lungo nello spazio dell'intelligenza artificiale (AI), Goldman Sachs ha pubblicato un report in cui si stimava che l'emergere dell'AI generativa avrebbe potuto incrementare il PIL globale del 7% all'anno, pari a più di 7.000 miliardi di dollari in più ogni anno.
In che modo l'AI generativa può raggiungere questo obiettivo? Le applicazioni di questa tecnologia sono numerose, ma in generale possono essere descritte come un miglioramento dell'efficienza della comunicazione tra uomo e macchina. Questo miglioramento porterà all'automazione dei compiti di basso livello e all'aumento delle capacità umane, consentendo ai lavoratori di fare di più con maggiore competenza.
A causa delle applicazioni ad ampio raggio e della complessità dell'AI generativa, molti resoconti dei media potrebbero indurre i lettori a credere che questa Tecnologia sia una panacea quasi magica. In effetti, questa prospettiva ha caratterizzato gran parte della copertura sull'AI generativa mentre il rilascio di ChatGPT e di altri strumenti ha reso la tecnologia mainstream nel 2022, con alcuni analisti che prevedevano che fossimo sull'orlo di una rivoluzione che avrebbe rimodellato il futuro del lavoro.
Nemmeno due anni dopo, l'entusiasmo dei media per l'AI generativa si è leggermente raffreddato. A giugno, Goldman Sachs ha pubblicato un altro report con una valutazione più misurata, mettendo in dubbio se i vantaggi dell'AI generativa possano giustificare l'investimento da un trilione di dollari nel suo sviluppo. Il Financial Times, tra le altre testate, ha pubblicato un op-ed con una visione altrettanto scettica. Il team della IBM Think Newsletter ha riassunto e risposto ad alcune di queste incertezze in un post precedente.
Le successive fluttuazioni del mercato azionario hanno portato diversi analisti a proclamare che la "bolla dell'AI" stava per scoppiare, e che sarebbe potuta seguire una correzione del mercato simile al crollo delle dot-com degli anni '90.
Lo scetticismo dei media nei confronti dell'AI generativa può essere suddiviso in quattro distinte crisi che gli sviluppatori devono affrontare:
Si tratta di ostacoli seri, ma molti restano ottimisti sul fatto che risolvere l'ultimo problema (i casi d'uso) aiuterà a risolvere gli altri 3. La buona notizia è che stanno già identificando e lavorando su casi d'uso significativi.
"L'AI generativa sta avendo un impatto notevole e misurabile su noi stessi e sui nostri clienti, e sta cambiando radicalmente il nostro modo di lavorare", afferma Chris Hay, illustre ingegnere IBM. "Questo vale per tutti i settori e le discipline, dalla trasformazione dei processi delle risorse umane e delle trasformazioni del marketing, ai contenuti di marca, ai contact center o allo sviluppo di software. Hay ritiene che ci troviamo nella fase correttiva che spesso segue un periodo di entusiasmo dilagante, e forse il recente pessimismo mediatico può essere visto come un tentativo di bilanciare affermazioni precedenti che, col senno di poi, erano solo hype.
"Non vorrei essere quell'analista", afferma Hay, riferendosi a una delle più fosche previsioni recenti sul futuro dell'AI. "Non vorrei essere la persona che dice: 'L'AI non farà nulla di utile nei prossimi 10 anni', perché verrei citato per il resto della mia vita".
Tali affermazioni potrebbero rivelarsi miopi come le affermazioni secondo cui le prime versioni di internet non sarebbero stati un granché o l'ipotesi del 1943 di Thomas Watson, fondatore di IBM, secondo cui il mondo non avrebbe avuto bisogno di più di 5 computer. Hay sostiene che parte del problema sia che i media spesso confondono la gen AI con un'applicazione più ristretta dei chatbot basati su LLM come ChatGPT, che potrebbero effettivamente non essere attrezzati per risolvere ogni problema che le aziende devono affrontare.
Quando iniziamo a riscontrare problemi di fornitura, che si tratti di dati, elaborazione o energia, Hay ritiene che gli ingegneri debbano tirare fuori la creatività per risolverli.
"Se hai qualcosa in grandi quantità, la consumi", afferma Hay. "Se hai centinaia di migliaia di GPU in giro, le usi. Ma quando hai dei vincoli, devi appellarti alla creatività."
Ad esempio, i dati sintetici rappresentano un modo promettente per risolvere la crisi dei dati. Vengono creati in modo algoritmico per imitare le caratteristiche dei dati reali e possono fungere da alternativa o supplemento a essi. Sebbene gli ingegneri di machine learning debbano prestare attenzione all'uso eccessivo di dati sintetici, un approccio ibrido può aiutare a superare la scarsità di dati reali nel breve termine. Ad esempio, i recenti modelli Microsoft PHI-3.5 o i modelli Hugging Face SMOL sono stati addestrati con notevoli quantità di dati sintetici, dando vita a modelli di piccole dimensioni altamente capaci.
Gli LLM di oggi consumano un'enorme quantità di energia, ma ci sono pochi motivi per credere che i trasformatori attuali siano l'architettura definitiva. I modelli basati su SSM, come Mistral Codestral Mamba, Jamba 1.5 o Falcon Mamba 1.5, stanno guadagnando popolarità grazie alle loro maggiori funzionalità di lunghezza del contesto. Anche le architetture ibride che utilizzano più tipi di modelli stanno guadagnando terreno. Oltre all'architettura, gli ingegneri trovano valore in altri metodi, come la quantizzazione, i chip progettati specificamente per l'inferenza e la messa a punto, una tecnica di deep learning che prevede l'adattamento di un modello pre-addestrato per casi d'uso specifici.
"Mi piacerebbe vedere una comunità più attiva nel settore, concentrata sulla messa a punto, piuttosto che sulla formazione preliminare", dichiara Hay. "La formazione preliminare è la parte più costosa del processo. La messa a punto è molto più economica e, potenzialmente, si può ottenere molto di più."
Hay suggerisce che in futuro potremmo avere più GPU di quante ne sappiamo cosa fare perché le nostre tecniche sono diventate molto più efficienti. Di recente ha sperimentato la trasformazione di un laptop in una macchina in grado di addestrare i modelli. Ricostruendo pipeline dati più efficienti e modificando il batching, sta cercando modi per lavorare entro i limiti. Naturalmente avrebbe potuto fare tutto questo con una costosa GPU H100 Tensor Core, ma la mentalità di scarsità gli ha permesso di trovare modi più efficienti per ottenere i risultati desiderati. La necessità era la madre dell'invenzione.
I modelli stanno diventando più piccoli e più potenti.
"Se si osservano i modelli più piccoli di oggi, si nota che sono addestrati con più token rispetto ai modelli più grandi dell'anno scorso", afferma Hay. "Si stanno inserendo più token nei modelli più piccoli, e questi modelli stanno diventando più efficienti e veloci."
"Quando pensiamo alle applicazioni dell'AI per risolvere problemi reali di business, scopriamo che questi modelli speciali stanno diventando sempre più importanti", afferma Brent Smolinksi, Global Head of Tech, Data and AI Strategy di IBM. Questi includono i cosiddetti modelli linguistici di piccole dimensioni e modelli non generativi, come i modelli di previsione, che richiedono un insieme di dati più ristretto. In questo contesto, la qualità dei dati spesso prevale sulla quantità. Inoltre, questi modelli speciali consumano meno energia e sono più facili da controllare.
"Molte ricerche sono in corso per sviluppare algoritmi più efficienti dal punto di vista computazionale", aggiunge Smolinksi. I modelli più efficienti indirizzano tutte e 4 le crisi proposte: consumano meno dati, energia e risorse di calcolo e, essendo più veloci, aprono nuovi casi d'uso.
"Gli LLM sono fantastici perché hanno un'interfaccia conversazionale molto naturale e più dati inserisci, più naturale sembra la conversazione", afferma Smolinksi. "Ma questi LLM, nel contesto di domini o problemi ristretti, sono soggetti ad allucinazioni, il che rappresenta un vero problema. Quindi, i nostri clienti spesso optano per modelli linguistici di piccole dimensioni e, se l'interfaccia non è perfettamente naturale, va bene lo stesso perché per certi problemi non è necessario."
L'AI generativa potrebbe non essere una panacea, ma è uno strumento potente a disposizione. Consideriamo il workflow agenziale, che si riferisce a un approccio in più fasi all'utilizzo di LLM e Agenti AI per eseguire compiti. Questi agenti agiscono con un certo grado di indipendenza e funzionalità di processo decisionale, interagendo con dati, sistemi e talvolta con le persone, per completare i compiti assegnati. Gli agenti specializzati possono essere incaricati di gestire compiti o aree di competenza specifiche, apportando conoscenze ed esperienze approfondite che potrebbero mancare agli LLM. Questi agenti possono attingere a dati più specializzati o integrare algoritmi e modelli specifici per il dominio.
Immagina una società di telecomunicazioni in cui un workflow basato sugli agenti orchestrato da un LLM gestisce in modo efficiente il supporto clienti. Quando un cliente invia una richiesta, il LLM elabora la richiesta, categorizza il problema e attiva agenti specifici a gestire vari compiti. Ad esempio, un agente recupera i dati del conto del cliente e verifica le informazioni fornite, mentre un altro diagnostica il problema, come effettuare controlli sulla rete o esaminare discrepanze di fatturazione.
Una volta identificato il problema, un terzo agente formula una soluzione, che si tratti di ripristinare l'attrezzatura, offrire un rimborso o programmare l'intervento di un tecnico. L'LLM assiste poi un agente di comunicazione a generare una risposta personalizzata al cliente, aiutando a garantire che il messaggio sia chiaro e coerente con la voce del marchio dell'azienda. Dopo aver risolto il problema, viene avviato un feedback, in cui un agente raccoglie i feedback dei clienti per determinare la soddisfazione. Se il cliente è insoddisfatto, l'LLM recensioni il feedback e potrebbe attivare altre azioni di follow-up, come una chiamata da un agente umano.
Pur essendo versatili, gli LLM possono avere difficoltà con i compiti che richiedono una profonda esperienza nel dominio o una conoscenza specializzata, soprattutto quando questi compiti non rientrano nei dati di addestramento dell'LLM. Sono anche lenti e poco adatti a prendere decisioni in tempo reale in ambienti dinamici. Al contrario, gli agenti possono operare in modo autonomo e proattivo, in tempo reale, utilizzando algoritmi di processo decisionale più semplici.
Gli agenti, a differenza dei grandi LLM monolitici, possono anche essere progettati per apprendere e adattarsi al loro ambiente. Possono utilizzare l'apprendimento per rinforzo o i cicli di feedback per migliorare le prestazioni nel tempo, adattando le strategie in base al successo o al fallimento dei compiti precedenti. I workflow basati sugli agenti generano nuovi dati, che possono poi essere utilizzati per ulteriori formazioni.
Questo scenario evidenzia come un LLM sia una parte utile per risolvere un problema aziendale, ma non l'intera soluzione. Questa è una buona notizia, perché l'LLM è spesso la parte più costosa della catena del valore.
Smolinksi sostiene che spesso le persone esagerano quando sono entusiaste delle nuove tecnologie. Potremmo pensare che una nuova tecnologia trasformerà il mondo, e quando non ci riuscirà, diventiamo eccessivamente pessimisti.
"Penso che la verità stia nel mezzo", afferma, sostenendo che l'AI debba essere parte di una strategia più ampia per risolvere i problemi aziendali. "L'AI non è mai da sola e, anche se lo fosse, si tratta di utilizzare più tipi di modelli di AI che vengono applicati in tandem per risolvere un problema. Ma bisogna partire dal problema. Se esiste un'applicazione di AI che potrebbe avere un impatto significativo sul tuo processo decisionale che, a sua volta, porterebbe a un impatto finanziario concreto, concentrati su quelle aree e poi cerca di applicare il giusto insieme di tecnologia e AI. Utilizza il toolkit completo, quindi non solo gli LLM ma l'intera gamma di strumenti disponibili.
Per quanto riguarda la cosiddetta "crisi dei casi d’uso", Hay è fiducioso che emergeranno casi d'uso ancora più convincenti che giustificheranno il costo di questi modelli.
"Se ci aspettiamo che la tecnologia sia perfetta ed entriamo nel mercato solo quando tutto è normalizzato, è un buon modo per venire travolti dalla marea", afferma. "Personalmente, non correrei questo rischio."