GPU AMD Instinct MI300X su IBM Cloud

Progettato per offrire prestazioni leader per workload di AI generativa e applicazioni HPC
Infrastruttura IBM Cloud per l'AI
La GPU AMD Instinct MI300X offre 192 GB di memoria HBM3

Questa potente GPU garantisce prestazioni leader per i data center, a qualsiasi livello. Queste GPU sono particolarmente adatte per alimentare anche i workload AI e HPC più impegnativi, offrendo prestazioni di calcolo eccezionali, grande densità di memoria, memoria a larghezza di banda elevata e supporto per formati di dati specializzati.

Il supporto per IBM watsonx®, Red Hat® OpenShift® Kubernetes Service e un'implementazione automatizzata basata su Terraform sono previsti per il primo semestre del 2025. Il supporto per i cluster AI Red Hat OpenShift, il servizio IBM Cloud® Kubernetes Service e le architetture implementabili su IBM Cloud è previsto per la seconda metà del 2025.

Vantaggi
Grafici e tabelle visualizzati su un'illustrazione di sfondo pulita
Riduzione del TCO su larga scala

192 GB di memoria HBM3 forniscono prestazioni di AI generativa convenienti per più modelli AI o modelli AI più grandi su larga scala, quindi sono necessarie meno GPU.

Icona cloud che rappresenta documenti, processi, illustrazione integrata
Elevate prestazioni AI e HPC

La GPU è ottimizzata per le operazioni matriciali e tensoriali con precisione FP8, FP16, BF16 e INT8, bilanciando prestazioni e precisione.

Applicazione che mostra una varietà di colori in diverse sezioni e presenta illustrazioni
Sviluppo aperto

Il software aperto AMD-ROCm include un'ampia gamma di modelli di programmazione, strumenti, compilatori, librerie e tempi di esecuzione. Grazie al supporto delle API implementate dai leader del settore, gli sviluppatori possono trasferire facilmente il codice di sviluppo.

L'istanza MI300X su IBM Cloud
L'istanza su IBM Cloud presenta le seguenti specifiche
  • 208 vCPU
  • 1.792 GB di RAM
  • 8 x 3,2 TB di spazio di storage istanze
  • 8 x GPU AMD Instinct MI300X
Distribuisci in base ai requisiti della tua infrastruttura e del tuo software

Le GPU AMD Instinct MI300X sono abbinate a processori Intel Xeon® di quarta generazione su IBM Cloud® Virtual Servers for VPC.

Infrastruttura IBM Cloud per l'AI
Attiva un server autonomo su IBM Cloud Virtual Private Cloud (VPC)

Le GPU AMD Instinct MI300X possono essere distribuite tramite istanze cloud IBM Cloud Virtual Servers for VPC. IBM Cloud VPC è progettato per un'elevata resilienza e sicurezza all'interno di una rete definita dal software (SDN), dove i clienti possono sviluppare cloud privati isolati e benefici essenziali del cloud pubblico. L'istanza cloud con GPU AMD Instinct MI300X, che supporta anche le immagini AI di Red Hat Enterprise Linux, è ideale per i clienti con stack software altamente specializzati o per chi necessita del totale controllo del server sottostante.

Configurazione, prezzo e preventivo
Risorse
Illustrazione astratta che rappresenta un globo
Demo di IBM watsonx.ai
Fai un tour dello studio per sviluppatori watsonx.ai®. Crea prompt, sperimenta con foundation model e crea modelli di apprendimento automatico (ML).
Guarda questo breve video su Red Hat OpenShift AI su IBM Cloud.
Un disegno blu e bianco con cerchi.
Documentazione di IBM Cloud VPC
Scopri di più su IBM Cloud Virtual Private Cloud. Esplora le guide al provisioning, i tutorial e altro ancora.
Prodotti correlati
Watsonx con logo del sottomarchio
IBM watsonx
Esplora un intero portfolio di prodotti AI che accelerano l'impatto dell' AI generativa nei principali workflow per aumentare la produttività.
Illustrazione di uno sviluppatore che lavora su un laptop utilizzando tecnologie hybrid cloud, tra cui OpenShift, Kubernetes e IBM Cloud.
Red Hat AI on IBM Cloud
Porta sul mercato applicazioni e iniziative AI mission-critical con Red Hat AI InstructLab™, Red Hat OpenShift AI e Red Hat Enterprise Linux® AI.
Un team di due imprenditori creativi parla della strategia di crescita mentre guarda un laptop.
IBM Cloud Kubernetes Service
Scegli una soluzione Kubernetes certificata e gestita, sviluppata per creare un cluster di host di calcolo allo scopo di distribuire applicazioni containerizzate su IBM Cloud. IBM gestisce l'istanza principale, liberandoti dal sistema operativo host, dal tempo di esecuzione e dai processi di aggiornamento della versione.
Programmatore IT professionista che lavora in un data center su un computer desktop con tre display.
Architetture distribuibili su IBM Cloud
Accelera l'innovazione, migliora l'efficienza e mantieni la sicurezza e la conformità ottimizzando i costi.
Un diagramma di flusso numerato etichettato con icone e numeri.
Pattern di Retrieval Augmented Generation (RAG) su IBM Cloud
Automatizza l'implementazione di RAG con il supporto dei servizi IBM Cloud e watsonx e integra i dati aziendali nelle soluzioni di AI generativa.
Corridoio in una stanza di server
IBM Cloud Virtual Server for VPC
Utilizza macchine virtuali altamente scalabili, single-tenant e multi-tenant, che puoi avviare rapidamente per ottenere il massimo isolamento e controllo della rete.
Inizia ora

Esplora le istanze GPU AMD MI300X su IBM Cloud.

 

Configurazione e prezzo Leggi la documentazione