GPU AMD Instinct MI300X sur IBM Cloud

Conçu pour offrir des performances de pointe pour les workloads d’IA générative et les applications HPC
Infrastructure IBM Cloud pour l'IA
Le GPU AMD Instinct MI300X offre 192 Go de mémoire HBM3

Ce puissant GPU permet d’obtenir des performances de pointe pour les centres de données, à n’importe quelle échelle. Ces GPU sont parfaitement adaptés pour alimenter les workloads d’IA et de HPC les plus exigeants, offrant des performances de calcul exceptionnelles, une grande densité de mémoire, une mémoire à large bande passante et une prise en charge des formats de données spécialisés.

La prise en charge d’IBM watsonx, de Red Hat OpenShift Kubernetes Service et d’un déploiement automatisé basé sur Terraform est prévue pour le premier semestre 2025. La prise en charge des clusters d’IA Red Hat OpenShift, d’IBM Cloud Kubernetes Service et des architectures déployables sur IBM Cloud est prévue pour le deuxième semestre 2025.

Avantages
Graphiques et diagrammes affichés sur un fond d’écran propre
Faible coût total de possession à l’échelle

Les 192 Go de mémoire HBM3 offrent des performances d’IA générative rentables pour des modèles d’IA plus nombreux ou plus grands à l’échelle, réduisant ainsi le nombre de GPU nécessaires.

Illustration d’une icône de nuage représentant des processus et documents intégrés
Hautes performances IA et HPC

Le GPU est optimisé pour les opérations de matrices et de tenseurs avec une précision FP8, FP16, BF16 et INT8, équilibrant ainsi les performances et la précision.

Application affichant différentes couleurs dans différentes sections et illustration de ses fonctionnalités
Développement ouvert

Le logiciel ouvert AMD-ROCm comprend un large ensemble de modèles de programmation, d’outils, de compilateurs, de bibliothèques et d’environnements d’exécution. La prise en charge des API déployées par les leaders du secteur simplifie le portage du code de développement pour les développeurs.

L'instance MI300X sur IBM Cloud
L'instance sur IBM Cloud est livrée avec les spécifications suivantes
  • 208 vCPU
  • 1 792 Go de RAM
  • 8 instances de stockage de 3,2 To
  • 8 x GPU AMD Instinct MI300X
Déployez en fonction de votre infrastructure et de vos exigences logicielles

Les GPU AMD Instinct MI300X sont associés aux processeurs Intel Xeon de 4e génération sur IBM Cloud Virtual Servers for VPC.

Infrastructure IBM Cloud pour l'IA
Mettez à disposition un serveur autonome sur IBM Cloud Virtual Private Cloud (VPC)

Les GPU AMD Instinct MI300X peuvent être déployés via des instances cloud d’IBM Cloud Virtual Servers for VPC. IBM Cloud VPC est conçu pour offrir une résilience et une sécurité élevées au sein d’un réseau défini par logiciel (SDN), où les clients peuvent créer des clouds privés isolés et profiter des avantages essentiels du cloud public. L’instance cloud de GPU AMD Instinct MI300X, qui prend également en charge les images Red Hat Enterprise Linux AI, est idéale pour les clients disposant d’une pile logicielle hautement spécialisée, ou pour ceux qui ont besoin d’un contrôle total sur leur serveur sous-jacent.

Configuration, tarifs, devis
Ressources
Illustration abstraite représentant un globe
Démo IBM watsonx.ai
Découvrez le studio de développement watsonx.ai. Créez des prompts, expérimentez des modèles de fondation et créez des modèles de ML.
Regardez cette courte vidéo sur Red Hat OpenShift AI on IBM Cloud.
Un motif bleu et blanc avec des cercles.
Documents IBM Cloud VPC
En savoir plus sur IBM Cloud Virtual Private Cloud. Explorez les guides de provisionnement, les tutoriels et autres ressources.
Produits associés
Watsonx avec logo de sous-marque
IBM watsonx
Découvrez un portefeuille complet de produits d’IA qui accélèrent l’impact de l’IA générative dans les principaux workflows pour stimuler la productivité.
Illustration d’un développeur travaillant sur un ordinateur portable et utilisant des technologies de cloud hybride, notamment Redhat OpenShift, Kubernetes et IBM Cloud.
IA Red Hat sur IBM Cloud
Commercialisez des applications et des initiatives d’IA essentielles avec Red Hat AI InstructLab, Red Hat OpenShift AI et Red Hat Enterprise Linux AI.
Une équipe de deux entrepreneurs créatifs discute d'une stratégie de croissance en regardant un ordinateur portable.
IBM Cloud Kubernetes Service
Choisissez une solution Kubernetes certifiée et gérée, conçue pour créer un cluster d’hôtes de calcul et déployer des applications conteneurisées sur IBM Cloud. IBM gère l'instance principale, vous libérant ainsi des processus de système d'exploitation hôte, d'exécution et de mise à jour de version.
Programmeur informatique professionnel travaillant dans un centre de données sur un ordinateur de bureau avec trois écrans
Architectures déployables sur IBM Cloud
Accélérez l’innovation, améliorez l’efficacité et maintenez la sécurité et la conformité tout en optimisant les coûts.
Organigramme numéroté portant des icônes et des chiffres.
Modèle de génération augmentée de récupération (RAG) sur IBM Cloud
Automatisez le déploiement de la RAG avec les services IBM Cloud et watsonx, et intégrez vos données d’entreprise dans des solutions d’IA générative.
Un couloir dans une salle de serveurs
IBM Cloud Virtual Servers for VPC
Utilisez des machines virtuelles hautement évolutives, à un ou plusieurs locataires, que vous pouvez lancer rapidement pour une isolation et un contrôle réseau optimaux.
Lancez-vous

Découvrez les instances de GPU AMD MI300X sur IBM Cloud.

 

Configuration et tarifs Lire la documentation