Acceleratori AI Intel® Gaudi® 3 su IBM Cloud

IBM Cloud è il primo fornitore globale di cloud service a fornire Intel® Gaudi® 3

Sblocca, innova e implementa nuove soluzioni AI con gli acceleratori AI Intel^® Gaudi^® 3 su IBM Cloud®, progettati per aiutarti a scalare in modo conveniente per le esigenze di AI aziendali con alte prestazioni, flessibilità di distribuzione e sviluppo aperto.

Supporta un'ampia gamma di applicazioni e framework di inferenza di AI generativa, inclusi modelli linguistici di grandi dimensioni (LLM) e modelli multimodali (MMM). Inizia rapidamente con IBM Cloud Virtual Server for VPC o Red Hat OpenShift Kubernetes Service. Il supporto per IBM^® watsonx, i cluster AI Red Hat OpenShift, IBM Cloud Kubernetes Service, le architetture distribuibili su IBM Cloud e una distribuzione automatizzata basata su Terraform sono previsti per la seconda metà del 2025.

Scopri di più sulla tecnologia Intel Gaudi 3

Annunci

Una nuova soluzione per l'AI in ambito enterprise

Grafici e tabelle visualizzati su un'illustrazione di sfondo pulita

Prezzo e prestazioni AI competitivi

Ottieni prestazioni di AI generativa a costi contenuti per un'elevata capacità di inferenza e un costo totale di proprietà ottimizzato.

Icona cloud che rappresenta documenti, processi, illustrazione integrata

Scalabilità veloce ed efficiente

Aumenta facilmente la scalabilità del sistema con un'assistenza caratterizzata da capacità flessibile e senza i vincoli di un sistema chiuso.

Applicazione che mostra una varietà di colori in diverse sezioni e presenta illustrazioni

Sviluppo aperto, scelta di distribuzione

Accelera i workload AI con il modello di distribuzione Intel Gaudi 3 prescelto e contribuisci a rimuovere le barriere degli sviluppatori con modelli open source su un cloud pubblico a standard aperti.

Distribuisci in base ai requisiti della tua infrastruttura e del tuo software

Gli acceleratori AI Intel® Gaudi® 3 sono abbinati ai processori Intel® Xeon® di quinta generazione su IBM Cloud Virtual Servers for VPC.

Attiva un server autonomo su IBM Cloud Virtual Private Cloud (VPC)

Gli acceleratori AI Intel Gaudi 3 possono essere implementati tramite istanze cloud di IBM Cloud Virtual Servers for VPC. IBM Cloud VPC è progettato per un'elevata resilienza e sicurezza all'interno di una rete definita dal software in cui i clienti possono creare cloud privati isolati mantenendo i benefici essenziali del cloud pubblico. L'istanza cloud Intel Gaudi 3, che supporta anche le immagini AI di Red Hat Enterprise Linux, è ideale per i clienti con stack software altamente specializzati o per chi necessita del totale controllo del server sottostante.

Esplora la distribuzione del server

La differenza è nel design

Memoria ad alta larghezza di banda (HBM)

Accelera le prestazioni dell'AI generativa e costruisci con più token e più modelli su una singola scheda con 128 GB di capacità HBM a una velocità di larghezza di banda di 3,7 TB/sec.

Ethernet standard del settore

Elimina il fabric lock-in e contribuisci a ridurre i costi di integrazione, aumentando al contempo la tua scelta di commutazione con un Ethernet standard del settore.

Trasmissione dati ad alta capacità

Ottieni un'enorme capacità di scalare orizzontalmente e verticalmente con 24 porte 200 GbE ad alta capacità RoCE.

Sviluppo aperto

Semplifica lo sviluppo con l'estensione Intel^® Gaudi ^® 3 per PyTorch e contribuisci a ridurre i tempi di sviluppo e la manutenzione del codice con una libreria di modelli ottimizzata su Hugging Face.

Elevate prestazioni per core

Utilizza al meglio il Matrix Multiplication Engine dell'acceleratore AI Intel^®Gaudi^® 3 con core specializzati ad alte prestazioni, progettati per ridurre i trasferimenti di dati.

Migrazione semplificata

Modelli lift and shift con solo tre righe di codice su software aperto con Developer Tools intuitivi.

Risorse

Documenti Intel® Gaudi® 3

Inizia con gli acceleratori AI Intel® Gaudi® 3 su IBM Cloud. Esplora le guide al provisioning, i tutorial introduttivi, i dettagli del profilo e altro ancora.

Documentazione di IBM Cloud VPC

Scopri di più su IBM Cloud Virtual Private Cloud. Esplora le guide al provisioning, i tutorial introduttivi e altro ancora.

Illustrazione astratta che rappresenta un globo

Demo di IBM watsonx.ai

Fai un tour dello studio per sviluppatori watsonx.ai Impara a costruire prompt, sperimenta con i foundation model e costruisci modelli di apprendimento automatico (ML).

Scopri la partnership in azione con questo sguardo dietro le quinte a Intel Gaudi 3 on IBM Cloud

Programmatore IT professionale che lavora nel Data Center su un computer desktop con tre display, occupandosi dello sviluppo di software e hardware. I display mostrano Blockchain, concetto di architettura della rete dati

Infografica di Intel Gaudi 3

Visualizza e scarica insight rapidi su Intel Gaudi 3 on IBM Cloud

Primo piano sulla scrivania del computer con tastiera retroilluminata e le mani di una persona che digitano. Le schermate mostrano l'interfaccia utente del linguaggio di codifica. Ingegnere del software crea un'app innovativa di commercio elettronico. Sviluppo del programma

Infografica Intel e IBM Cloud: insieme è meglio

Visualizza e scarica insight per tutti i prodotti e servizi della partnership forniti su IBM Cloud

Domande frequenti

Gli acceleratori AI Intel^® Gaudi^® 3 su IBM Cloud sono progettati per workload AI ad alte prestazioni, con 64 Tensor Processor Core (TPC) e otto Matrix Multiplication Engine (MME), per aiutare ad accelerare i calcoli delle reti neurali profonde. Gli acceleratori AI Intel^® Gaudi^® 3 su IBM Cloud sono inoltre dotati di 128 GB di memoria HBM2E, offrono fino a 3,7 TB di larghezza di banda di memoria e supportano reti Ethernet standard di settore con porte 24x200 GbE, fornendo 9,6 Tbps di larghezza di banda bidirezionale per l'interconnettività scalabile del sistema.

Gli acceleratori AI Intel^® Gaudi^® 3 offrono un ampio supporto per le applicazioni AI, tra cui inferenza, generazione 3D, generazione di testo, classificazione, generazione di video, sentiment, traduzione, generazione di immagini, riepilogo e domande e risposte, con focus su multimodali, modelli linguistici di grandi dimensioni (LLM) e retrieval-augmented generation (RAG).

Con 128 GB di memoria HBM2E e fino a 3,7 TB/s di larghezza di banda di memoria, gli acceleratori AI Intel^® Gaudi^® 3 su IBM Cloud aiutano a garantire un rapido throughput dei dati veloci, riducendo i colli di bottiglia e consentendo agli sviluppatori di elaborare enormi set di dati in modo più rapido ed efficiente.

Gli acceleratori AI Intel^® Gaudi^® 3 su IBM Cloud sono integrati negli IBM Cloud Virtual Servers su IBM Cloud Virtual Private Cloud (VPC). L'IBM Cloud VPC è una rete SDN (Software-Defined Network) altamente resiliente e sicura su cui è possibile creare cloud privati isolati, mantenendo al contempo i benefici fondamentali offerti dal cloud pubblico. Il profilo del virtual server Intel^® Gaudi^® 3 su IBM Cloud VPC è una combinazione preconfigurata di vCPU, RAM e storage per avviare rapidamente un'istanza di virtual server.

Gli acceleratori AI Intel^® Gaudi^® 3 su IBM Cloud supportano i framework più diffusi, tra cui PyTorch, ONNX e DeepSpeed. Su Hugging Face sono disponibili oltre 400.000 modelli, ottimizzati per l'uso con libreria software Optimum Habana. L'intero supporto per la suite di software e il framework Intel^® Gaudì^® è progettato per agevolare la migrazione, consentendo agli sviluppatori di integrare i modelli in uso con modifiche minime al codice.

Prodotti correlati

Red Hat OpenShift on IBM Cloud

Crea il tuo cluster Red Hat OpenShift di host di calcolo per distribuire e gestire le app containerizzate su IBM Cloud Virtual Servers, bare metal server o sul tuo hardware o cloud di terze parti con IBM Cloud Satellite.

IBM watsonx

Esplora un intero portfolio di prodotti AI che accelerano l'impatto dell' AI generativa nei principali workflow per aumentare la produttività.

IBM Cloud Kubernetes Service

Scegli una soluzione Kubernetes certificata e gestita, sviluppata per creare un cluster di host di calcolo allo scopo di distribuire applicazioni containerizzate su IBM Cloud. IBM gestisce il master, liberando l'utente da processi relativi al sistema operativo host, al tempo di esecuzione e all'aggiornamento della versione.

Architetture distribuibili su IBM Cloud

Distribuisci agevolmente applicazioni e sistemi in diversi ambienti con un set preconfigurato di codice di infrastruttura (IaC) per una distribuzione senza interruzioni che consenta agli sviluppatori e ai team delle operazioni di implementare rapidamente nuove caratteristiche e aggiornamenti di sistema.

Pattern di Retrieval Augmented Generation (RAG) su IBM Cloud

Automatizza l'implementazione di RAG con il supporto dei servizi IBM Cloud e watsonx e integra i dati aziendali nelle soluzioni di AI generativa.

IBM Cloud Virtual Server for VPC

Macchine virtuali altamente scalabili, single-tenant e multi-tenant, che puoi avviare rapidamente per ottenere il massimo isolamento e controllo della rete.

Prossimi passi

Esplora gli acceleratori AI Intel® Gaudi® 3 su IBM Cloud.