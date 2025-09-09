Per superare questi vincoli infrastrutturali, il Calmon Lab ha collaborato con IBM. Utilizzando IBM® Cloud, hanno fornito due server NVIDIA HGX H100 8-GPU all'interno di un cloud privato virtuale sicuro (VPC), ciascuno dotato di 640 GB di memoria GPU e 2 TB di memoria fisica. La configurazione includeva lo storage a blocchi ad alte operazioni di input/output al secondo (IOPS), la condivisione rapida dei file di rete e IBM® Cloud Object Storage per un trasferimento dei dati senza interruzioni.

Utilizzando Red Hat Enterprise Linux 9, la piattaforma Anaconda e il modello linguistico virtuale di grandi dimensioni (vLLM) per il model serving, il laboratorio è passato rapidamente a un ambiente ad alte prestazioni. Nel giro di una settimana, il team ha eseguito l'inferenza a oltre 2.000 token al secondo e ha addestrato i modelli senza ritardi. Questa trasformazione ha permesso loro di esplorare nuove frontiere nella sicurezza dell'AI, tra cui l'identificazione di percorsi di ragionamento improduttivi e il perfezionamento delle tecniche di allineamento dei modelli.