Nella fretta di abbracciare l'AI generativa, le aziende si trovano di fronte a un ostacolo inaspettato: i costi di calcolo alle stelle, che rischiano di far deragliare l'innovazione e gli sforzi di business transformation.
Anche i principali attori dell'AI avvertono la pressione economica. OpenAI, a quanto pare, sta registrando una crescita esplosiva dei ricavi, con utili mensili che hanno raggiunto i 300 milioni di USD nell'agosto 2024. All'inizio di ottobre, l'azienda ha annunciato di aver raccolto 6,6 miliardi di dollari americani in un nuovo round di finanziamento con una valutazione di 157 miliardi, uno sforzo per tenere il passo con i costi alle stelle e i piani di crescita ambiziosi.
Un nuovo report dell'Institute for Business Value (IBV) di IBM dipinge un quadro preoccupante delle difficoltà economiche dei dirigenti che affrontano la rivoluzione dell'AI. Il report, intitolato "La guida del CEO all'AI generativa: il costo dell'elaborazione", rivela che, secondo le previsioni, il costo medio dell'elaborazione aumenterà dell'89% tra il 2023 e il 2025. Un impressionante 70% dei dirigenti IBM intervistati cita l'AI generativa come un driver critico di questo aumento. E l'impatto si sta già avvertendo in diversi settori, con ogni dirigente che segnala la cancellazione o il rinvio di almeno un'iniziativa di AI generativa per motivi di costo.
"Al momento, molte organizzazioni stanno facendo esperimenti, quindi questi costi non stanno necessariamente aumentando quanto faranno una volta che inizieranno a scalare l'AI", afferma Jacob Dencik, Research Director presso IBV. "Il costo del calcolo, spesso riflesso nei costi del cloud, sarà una questione chiave da considerare, poiché rappresenta potenzialmente un ostacolo per loro nella scalare efficacemente l'AI."
Gli aspetti economici dell'AI stanno emergendo come un fattore critico nel determinarne il reale impatto sul business. Come sottolinea Dencik, "Anche se tecnicamente fosse possibile realizzare qualcosa con l'AI, se il business case non regge a causa del costo dell'elaborazione o del costo di addestramento di questi modelli, allora non vedremo l'impatto dell'AI sulle attività aziendali che molti si aspettano".
Adnan Masood, Chief AI Architect di UST, inquadra questa sfida in termini netti: "Stiamo entrando in un punto di svolta strategico, in cui l'innovazione, una volta vista come una necessità competitiva, ora comporta un rischio finanziario sostanziale". Aggiunge: "La lunga marcia verso il dominio dell'AI non è per i deboli di cuore. Stiamo guardando a un futuro in cui le aziende devono fare scommesse strategiche su se Continua a spingere i Boundary dell'AI o rischiare di rimanere indietro... nella corsa ARM dell'AI."
Molte organizzazioni si stanno rivolgendo ad architetture hybrid cloud per contrastare l'aumento dei costi. "L'hybrid cloud diventa un meccanismo per garantire la gestione dei costi di elaborazione", afferma Dencik. "L'utilizzo di una piattaforma di cloud ibrido che include un piano di controllo comune e funzionalità di operazioni finanziarie le offre la visibilità necessaria per eseguire dati, workload e applicazione negli ambienti a basso costo. Ti consentirà di vedere dove vengono generati i costi e come ottimizzarli."
Gli esperti affermano che la strada da seguire è molto più che ridurre i costi. "Si può utilizzare l'AI generativa per migliorare l'efficienza della codifica; il modo in cui si codifica un'applicazione può renderla più o meno energivora nel suo utilizzo. Secondo alcune stime, è possibile ridurre il consumo energetico dell'utilizzo di un'applicazione fino al 50% passando a un linguaggio di codifica migliore e a un codice più efficiente".
Le organizzazioni stanno anche utilizzando l'AI generativa per ottimizzare la disposizione dei data center e migliorare la progettazione dei server. "Ci sono vari modi in cui l'AI generativa può supportare l'efficienza del calcolo e delle risorse di elaborazione", afferma Dencik. “Può essere parte della soluzione, piuttosto che semplicemente la fonte del problema.”
Masood suggerisce strategie aggiuntive: "Esistono modi creativi per affrontare queste sfide, come il routing degli LLM, o indirizzare in modo intelligente le richieste in arrivo al modello di linguaggio più adatto in base a fattori come complessità, costo e prestazioni, garantendo un utilizzo efficiente delle risorse e risultati ottimali." Inoltre, fa riferimento all'"abbassamento dei costi di gestione degli LLM riducendone le dimensioni e rendendoli più veloci. Utilizzare la quantizzazione per ridurre la memoria necessaria al modello e una messa a punto efficiente per velocizzare l'addestramento significa costi hardware più bassi e tempi di elaborazione più rapidi, rendendo questi modelli più accessibili da distribuire e utilizzare."
La crescente complessità dei modelli AI è un altro fattore che fa aumentare i costi. Dencik consiglia un approccio strategico: "Non è necessario utilizzare grandi modelli linguistici per ogni cosa", afferma. "Un modello di piccole dimensioni addestrato su dati di alta qualità può essere più efficiente e ottenere gli stessi risultati, o migliori, a seconda del compito da svolgere. La selezione del modello appropriato è fondamentale, mentre il riutilizzo e la messa a punto dei modelli esistenti può essere migliore della creazione di nuovi modelli per ogni nuova attività per cui si desidera utilizzare l'AI".
Masood sostiene un approccio multimodale e multi-modello all'implementazione dell'AI: "Per essere conveniente, bisognerebbe consentire all'organizzazione di spostarsi verso un uso multimodale e multi-modello dell'AI e disporre di una piattaforma che consenta di farlo all'interno dell'organizzazione stessa". "Sebbene possa sembrare più complesso, è un modo per l'organizzazione di sfruttare al meglio l'AI nel modo più conveniente."
Anche le preoccupazioni relative alla sostenibilità influenzano il costo totale di proprietà dei sistemi di AI. Sebbene i costi energetici possano essere in gran parte nascosti nelle spese cloud, invece di comparire direttamente sulla fattura delle utenze, c'è una crescente consapevolezza dell'impatto ambientale dell'AI generativa. "Non è solo un costo economico; è un costo ambientale associato all'uso dell'AI," afferma Dencik. Indica pratiche emergenti come le “green ops”, che mirano a ottimizzare l’uso del cloud per ridurre l’impatto ambientale.
Man mano che le aziende affrontano queste sfide, imparare a gestire efficacemente i costi del calcolo potrebbe diventare un fattore chiave di differenziazione sul mercato. Il rapporto conclude che "i CEO che gestiranno al meglio questi costi saranno in grado di gestire il proprio business come una macchina ad alte prestazioni, riducendo la resistenza e utilizzando le tecnologie più recenti per superare la concorrenza."
