Acceleratori AI Intel® Gaudi® 3 su IBM Cloud

L'acceleratore AI potente, economico e aperto per i workload di AI generativa.

La vista ravvicinata di Gaudi 3 presenta 64 core di processore Tensor (TPC) e otto Matrix Multiplication Engine (MME)
IBM Cloud è il primo fornitore globale di cloud service a fornire Intel® Gaudi® 3

Sblocca, innova e implementa nuove soluzioni AI con gli acceleratori AI Intel® Gaudi® 3 su IBM Cloud®, progettati per aiutarti a scalare in modo conveniente per le esigenze di AI aziendali con alte prestazioni, flessibilità di distribuzione e sviluppo aperto.   

Supporta un'ampia gamma di applicazioni e framework di inferenza di AI generativa, inclusi modelli linguistici di grandi dimensioni (LLM) e modelli multimodali (MMM). Avvia rapidamente la distribuzione di IBM Cloud Virtual Servers for VPC. Il supporto per IBM watsonx®, Red Hat® OpenShift® Kubernetes Service e un'implementazione automatizzata basata su Terraform sono previsti per il primo semestre del 2025. Il supporto per i cluster AI Red Hat OpenShift, il servizio IBM Cloud® Kubernetes Service e le architetture implementabili su IBM Cloud è previsto per la seconda metà del 2025.

Scopri di più sulla tecnologia Intel Gaudi 3

Una nuova soluzione per l'AI in ambito enterprise
Grafici e tabelle visualizzati su un'illustrazione di sfondo pulita
Prezzo e prestazioni AI competitivi

Ottieni prestazioni di AI generativa a costi contenuti per un'elevata capacità di inferenza e un costo totale di proprietà ottimizzato.

 

Icona cloud che rappresenta documenti, processi, illustrazione integrata
Scalabilità veloce ed efficiente

Aumenta facilmente la scalabilità del sistema con un'assistenza caratterizzata da capacità flessibile e senza i vincoli di un sistema chiuso.

Applicazione che mostra una varietà di colori in diverse sezioni e presenta illustrazioni
Sviluppo aperto, scelta di distribuzione

Accelera i workload AI con il modello di distribuzione Intel Gaudi 3 prescelto e contribuisci a rimuovere le barriere degli sviluppatori con modelli open source su un cloud pubblico a standard aperti.

Distribuisci in base ai requisiti della tua infrastruttura e del tuo software

Gli acceleratori AI Intel®  Gaudi® 3 sono abbinati ai processori Intel® Xeon® di quinta generazione su IBM Cloud Virtual Servers for VPC.

La vista ravvicinata di Gaudi 3 presenta 64 core di processore Tensor (TPC) e otto Matrix Multiplication Engine (MME)
Attiva un server autonomo su IBM Cloud Virtual Private Cloud (VPC)

Gli acceleratori AI Intel Gaudi 3 possono essere implementati tramite istanze cloud di IBM Cloud Virtual Servers for VPC. IBM Cloud VPC è progettato per un'elevata resilienza e sicurezza all'interno di una rete definita dal software in cui i clienti possono creare cloud privati isolati mantenendo i benefici essenziali del cloud pubblico. L'istanza cloud Intel Gaudi 3, che supporta anche le immagini AI di Red Hat Enterprise Linux, è ideale per i clienti con stack software altamente specializzati o per chi necessita del totale controllo del server sottostante.

Esplora la distribuzione del server
La differenza è nel design
Memoria ad alta larghezza di banda (HBM)

Accelera le prestazioni dell'AI generativa e costruisci con più token e più modelli su una singola scheda con 128 GB di capacità HBM a una velocità di larghezza di banda di 3,7 TB/sec.

Ethernet standard del settore

Elimina il fabric lock-in e contribuisci a ridurre i costi di integrazione, aumentando al contempo la tua scelta di commutazione con un Ethernet standard del settore.

 

Trasmissione dati ad alta capacità

Ottieni un'enorme capacità di scalare orizzontalmente e verticalmente con 24 porte 200 GbE ad alta capacità RoCE.

Sviluppo aperto

Semplifica lo sviluppo con l'estensione Intel® Gaudi ® 3 per PyTorch e contribuisci a ridurre i tempi di sviluppo e la manutenzione del codice con una libreria di modelli ottimizzata su Hugging Face.

Elevate prestazioni per core

Utilizza al meglio il Matrix Multiplication Engine dell'acceleratore AI Intel® Gaudi® 3 con core specializzati ad alte prestazioni, progettati per ridurre i trasferimenti di dati.

Migrazione semplificata

Modelli lift and shift con solo tre righe di codice su software aperto con Developer Tools intuitivi.

Domande frequenti

Gli acceleratori AI Intel® Gaudi® 3 su IBM Cloud sono progettati per workload AI ad alte prestazioni, con 64 Tensor Processor Core (TPC) e otto Matrix Multiplication Engine (MME), per aiutare ad accelerare i calcoli delle reti neurali profonde. Gli acceleratori AI Intel® Gaudi® 3 su IBM Cloud sono inoltre dotati di 128 GB di memoria HBM2E, offrono fino a 3,7 TB di larghezza di banda di memoria e supportano reti Ethernet standard di settore con porte 24x200 GbE, fornendo 9,6 Tbps di larghezza di banda bidirezionale per l'interconnettività scalabile del sistema.

Gli acceleratori AI Intel® Gaudi® 3 offrono un ampio supporto per le applicazioni AI, tra cui inferenza, generazione 3D, generazione di testo, classificazione, generazione di video, sentiment, traduzione, generazione di immagini, riepilogo e domande e risposte, con focus su multimodali, modelli linguistici di grandi dimensioni (LLM) e retrieval-augmented generation (RAG).

Con 128 GB di memoria HBM2E e fino a 3,7 TB/s di larghezza di banda di memoria, gli acceleratori AI Intel® Gaudi® 3 su IBM Cloud aiutano a garantire un rapido throughput dei dati veloci, riducendo i colli di bottiglia e consentendo agli sviluppatori di elaborare enormi set di dati in modo più rapido ed efficiente.

Gli acceleratori AI Intel® Gaudi® 3 su IBM Cloud sono integrati negli IBM Cloud Virtual Servers su IBM Cloud Virtual Private Cloud (VPC). L'IBM Cloud VPC è una rete SDN (Software-Defined Network) altamente resiliente e sicura su cui è possibile creare cloud privati isolati, mantenendo al contempo i benefici fondamentali offerti dal cloud pubblico. Il profilo del virtual server Intel® Gaudi® 3 su IBM Cloud VPC è una combinazione preconfigurata di vCPU, RAM e storage per avviare rapidamente un'istanza di virtual server.

Gli acceleratori AI Intel® Gaudi® 3 su IBM Cloud supportano i framework più diffusi, tra cui PyTorch, ONNX e DeepSpeed. Su Hugging Face sono disponibili oltre 400.000 modelli, ottimizzati per l'uso con libreria software Optimum Habana. L'intero supporto per la suite di software e il framework Intel® Gaudì® è progettato per agevolare la migrazione, consentendo agli sviluppatori di integrare i modelli in uso con modifiche minime al codice.

 

Prodotti correlati Red Hat OpenShift on IBM Cloud
Crea il tuo cluster Red Hat OpenShift di host di calcolo per distribuire e gestire le app containerizzate su IBM Cloud Virtual Servers, bare metal server o sul tuo hardware o cloud di terze parti con IBM Cloud Satellite.
IBM watsonx
Esplora un intero portfolio di prodotti AI che accelerano l'impatto dell' AI generativa nei principali workflow per aumentare la produttività.
IBM Cloud Kubernetes Service
Scegli una soluzione Kubernetes certificata e gestita, sviluppata per creare un cluster di host di calcolo allo scopo di distribuire applicazioni containerizzate su IBM Cloud. IBM gestisce il master, liberando l'utente da processi relativi al sistema operativo host, al tempo di esecuzione e all'aggiornamento della versione.
Architetture distribuibili su IBM Cloud
Distribuisci agevolmente applicazioni e sistemi in diversi ambienti con un set preconfigurato di codice di infrastruttura (IaC) per una distribuzione senza interruzioni che consenta agli sviluppatori e ai team delle operazioni di implementare rapidamente nuove caratteristiche e aggiornamenti di sistema.
Pattern di Retrieval Augmented Generation (RAG) su IBM Cloud
Automatizza l'implementazione di RAG con il supporto dei servizi IBM Cloud e watsonx e integra i dati aziendali nelle soluzioni di AI generativa.
IBM Cloud Virtual Server for VPC
Macchine virtuali altamente scalabili, single-tenant e multi-tenant, che puoi avviare rapidamente per ottenere il massimo isolamento e controllo della rete.
Prossimi passi

Esplora gli acceleratori AI Intel® Gaudi® 3 su IBM Cloud.

Configurazione, prezzo e preventivo Leggi la documentazione