Benchmark, costi di inferenza, innovazione: in che modo l'AI sta rimodellando la nostra società? Quest'anno, l'AI Index Report del 2025 di Stanford ha aggiunto nuove aree di copertura per riflettere il ruolo crescente dell'AI in ogni aspetto delle nostre vite.
IBM Think ha analizzato alcune tendenze chiave nel rapporto con Vanessa Parli, Direttrice dei programmi di ricerca presso l'Institute for Human-Centered Artificial Intelligence di Stanford, e Ash Minhas, Technical Content Manager di IBM.
Un argomento più scottante che mai: i benchmark sono diventati un dibattito centrale ora che le capacità dell'AI stanno avanzando così rapidamente da superare costantemente gli strumenti utilizzati per misurarle.
"Ogni anno guardiamo come questi algoritmi si comportano nei benchmark, e ogni anno sembra che li stiano superando", afferma Vanessa Parli, una delle autrici del rapporto, in un'intervista con IBM Think. "Allo stesso modo, quest'anno, ciò sta accadendo anche con i nuovi benchmark".
Il report ha rilevato che nel 2023 i ricercatori hanno introdotto nuovi benchmark (MMMU, GPQA e SWE-bench) per testare i limiti dei sistemi di AI avanzati. Solo un anno dopo, le prestazioni sono aumentate drasticamente: i punteggi sono aumentati rispettivamente di 18,8, 48,9 e 67,3 punti percentuali su MMMU, GPQA e SWE-bench, secondo il rapporto.
Questo genera ambiguità all'interno della comunità di ricerca sul vero significato e valore di un benchmark LLM. Parli ha posto domande critiche da considerare: "Stiamo misurando la cosa giusta? Questi parametri di benchmark sono compromessi? E in che modo dovrebbe la comunità scientifica valutare i modelli?"
Guardando al futuro, Ash Minhas si chiede anche come sarà il futuro del benchmarking. "Dove andremo a finire?" chiede in un'intervista con IBM Think. "Il test di Turing dovrà essere un obiettivo costantemente in movimento? L'ultimo esame dell'umanità sarà davvero l'ultimo esame?"
Nel frattempo, gli esperti mettono in guardia dal rischio di overfitting, un fenomeno in cui un modello AI ha imparato a ottenere risultati eccezionali su test di benchmark specifici ma potrebbe non generalizzare a dati nuovi e mai visti in applicazioni reali. "E se stessimo solo addestrando il modello a superare il benchmark?" aggiunge. "L'MMMU è un buon benchmark, ma se lo fosse solo perché il modello sa come soddisfarne i requisiti?”
Minhas avverte anche che l'entusiasmo e lo slancio del progresso prendere il sopravvento rispetto all'etica, all'equità e ai pregiudizi.
Con i Premi Nobel per la Fisica e la Chimica assegnati lo scorso anno a ricercatori che lavorano su reti neurali e progettazione e previsione proteica, è difficile trascurare l'importanza del ruolo crescente dell'AI nel campo medico. Il report osserva che il numero di dispositivi medici abilitati dall'AI approvati dalla FDA è cresciuto esponenzialmente: nel 2023 ne sono stati approvati 223, rispetto a soli sei nel 2015.
"Questo ambito di AI che migliora la scoperta scientifica può avere un impatto significativo sulla nostra società", afferma Parli.
Secondo Minhas, questa crescita dimostra il rapido ritmo dell'innovazione, ma solleva anche domande: "abbiamo gli esperti e le competenze giuste per poter testare questi nuovi dispositivi e prodotti?"
L'AI è stata una forza chiave dietro grandi investimenti nel 2024. Il numero di startup di AI generativa appena finanziate è quasi triplicato e, dopo anni di adozione lenta, l'adozione da parte delle aziende ha subito un'accelerazione significativa nel 2024, secondo il rapporto.
L'AI è passata dall'essere una tecnologia marginale a diventare un driver centrale del valore aziendale. Gli investimenti aziendali totali in AI raggiungeranno i 252,3 miliardi di dollari nel 2024, con un aumento degli investimenti privati del 44,5% e delle fusioni e acquisizioni del 12,1% rispetto all'anno precedente. Ciò si presta a un fiorente ecosistema di startup negli Stati Uniti, dove gli investimenti privati nell'AI raggiungeranno 109,1 miliardi di dollari nel 2024.
Anche sul lavoro l'AI è un attore importante, e molti prevedono che l'impatto dell'agentic AI sui workflow aziendali
Tuttavia, le aziende vanno a un ritmo diverso rispetto all'innovazione. "La tecnologia sta facendo passi da gigante, ma le persone e i processi richiedono tempo per cambiare", afferma Minhas.
L'impatto dell'AI sul ROI è ancora discutibile, suggerisce. "Non c'è ancora una buona comprensione del beneficio economico", dice Minhas. "Nessuno è d’accordo su quale sia il ROI e nessuno lo sa veramente."
Il report ha evidenziato che anche i paesi di tutto il mondo stanno intensificando i loro investimenti nelle infrastrutture e, chiaramente, la pubblicazione di potenti modelli cinesi dimostra che i progressi statunitensi non dovrebbero essere dati per scontati.
"Non credo che possiamo dare per scontato che gli Stati Uniti saranno sempre in cima a queste classifiche, e dobbiamo Continua a Think su questi componenti dell'AI: calcolo, talenti, dati," dice Parli. "Dobbiamo continuare a investire se vogliamo mantenere la leadership nell'innovazione che abbiamo avuto in passato e assicurarci di avere gli ingredienti giusti per riuscirci."
Tuttavia, il report evidenzia un'altra tendenza interessante, se non contraddittoria: i Paesi con i maggiori investimenti nell'AI, come gli Stati Uniti, esprimono più scetticismo nei confronti dei prodotti e servizi di AI rispetto ai paesi con un budget tecnologico AI più limitato.
Secondo i dati condivisi nel report, l'80% delle persone intervistate in Indonesia ritiene che i prodotti di AI siano più vantaggiosi che dannosi, rispetto al solo 39% negli Stati Uniti.
"In molti paesi, l'AI consente l'accesso a determinate risorse, ad esempio la sanità, e penso che saremo più ottimisti riguardo all'AI e alle differenze culturali," spiega Parli. "Esistono anche differenze culturali su questioni come la privacy personale, la sicurezza e la privacy dei dati."
Infine, l'AI sarà più presente nello spazio fisico.
Il report ha rilevato che, dal 2013 al 2023, il numero di robot industriali installati a livello globale è quasi triplicato, con 541.000 unità installate nel 2023.
"Con alcuni strumenti di AI, che permettono di parlare al robot in linguaggio naturale, è possibile sfruttare il movimento", afferma Parli. "Si può lavorare a stretto contatto con i robot e sarà più facile collaborare con loro. Credo che l'assistenza sanitaria sia un'area in cui la robotica farà grandi passi avanti".
