Nella corsa per dominare l'AI, di solito più grande equivale a meglio. Più dati e più parametri creano sistemi di AI più grandi, che non sono solo più potenti ma anche più efficienti e veloci, ma generalmente creano meno errori rispetto ai sistemi più piccoli.

Le aziende tecnologiche che conquistano le prime pagine dei giornali rafforzano questa tendenza. "Il sistema che abbiamo appena implementato è, in termini di scala, grande quanto una balena", ha affermato Kevin Scott, CTO di Microsoft, a proposito del supercomputer che alimenta Chat GPT-5. Scott ha parlato dell'ultima versione del chatbot di AI generativa di Open AI durante il recente evento Build dell'azienda a fine maggio. "E a quanto pare è possibile creare un sacco di AI con un supercomputer grande quanto una balena."

Nel frattempo, la capitalizzazione di mercato di Nvidia ha raggiunto la soglia dei 3 trilioni di dollari a giugno. Il produttore di chip è cresciuto a un ritmo vertiginoso man mano che i suoi chip alimentano modelli linguistici sempre più grandi, supercomputer e data center che si moltiplicano in tutto il mondo.

Ma più grande è sempre meglio? Dipende dal tuo punto di vista. Per le aziende che sviluppano grandi modelli linguistici, la scalabilità è un vantaggio nella maggior parte dei casi. Ma mentre le aziende cercano di separare l'hype da ciò a cui l'AI può aggiungere un vero valore, non è chiaro se modelli linguistici sempre più ampi porteranno sempre a soluzioni migliori per le aziende.

In futuro, "non avremo bisogno di modelli 100 volte superiori a quelli che abbiamo oggi per estrarre la maggior parte del valore", ha affermato Kate Soule, direttrice del programma IBM per la ricerca sull'AI generativa, in un recente episodio del podcast Mixture of Experts di IBM. Molte aziende che stanno già ottenendo un ritorno sui loro investimenti in AI la utilizzano per attività come la classificazione e la sintesi, che non sfruttano nemmeno appieno la capacità degli attuali modelli linguistici.