L'intelligenza artificiale ha raggiunto una tappa fondamentale, in cui l'addestramento di modelli linguistici di grandi dimensioni (LLM) è uno dei compiti più impegnativi dal punto di vista del calcolo. Il calcolo ad alte prestazioni è fondamentale per l'ottimizzazione dell'AI generativa (gen AI) e del workload dei modelli LLM, nonché le unità di elaborazione grafica (GPU) possono essere costose e di scarsa qualità. Le GPU sono chip di computer specializzati, progettate per gestire calcoli matematici complessi e l'elaborazione in parallelo, il che le rendono ideali per i calcoli complessi richiesti nell'addestramento e nell'inferenza dei modelli di deep learning. Di conseguenza, le GPU sono molto richieste e l'ottimizzazione del loro utilizzo è fondamentale per il successo dell'AI.

Il team IBM® Big AI Models (BAM), che supporta l'ambiente di ricerca e sviluppo primario per i team di ingegneri che testano e perfezionano i loro progetti di gen AI, ha visto un'opportunità di miglioramento. Man mano che più progetti passavano attraverso la fase di test, il team ha riconosciuto l'importanza di utilizzare in modo ottimale ogni istanza per evitare sprechi di risorse.