Accélérateurs d’IA Intel Gaudí 3 sur IBM Cloud

L’accélérateur d’IA puissant, rentable et ouvert pour les workloads d’IA générative.

IBM Cloud est le premier fournisseur mondial de services cloud à proposer la technologie Intel Gaudi 3

Découvrez, innovez et déployez de nouvelles solutions d’IA avec les accélérateurs d’IA Intel Gaudi 3 sur IBM Cloud, conçus pour vous aider à répondre de manière rentable aux exigences des entreprises en matière d’IA avec des performances élevées, une flexibilité de déploiement et un développement ouvert.   

Prenez en charge un large éventail d’applications et de frameworks d’inférence pour l’IA générative, y compris les grands modèles de langage (LLM) et les modèles multimodaux (MMM). Démarrez rapidement avec IBM Cloud Virtual Server for VPC ou Red Hat OpenShift Kubernetes Service. La prise en charge d’IBM watsonx, des clusters d’IA Red Hat OpenShift, d’IBM Cloud Kubernetes Service, des architectures déployables sur IBM Cloud et d’un déploiement automatisé basé sur Terraform est prévue pour le deuxième semestre 2025.

En savoir plus sur la technologie Intel Gaudi 3

Une nouvelle solution pour l’IA d’entreprise
Graphiques et diagrammes affichés sur un fond d’écran propre
Prix et performances compétitifs de l’IA

Bénéficiez de performances d’IA générative rentables pour un débit d’inférence élevé et un coût total de possession optimisé.

 

Illustration d’une icône de nuage représentant des processus et documents intégrés
Mise à l’échelle rapide et efficace

Améliorez facilement l’évolutivité du système grâce à une prise en charge flexible de la capacité et à l’absence de systèmes fermés.

Application affichant différentes couleurs dans différentes sections et illustration de ses fonctionnalités
Développement ouvert, choix en matière de déploiement

Accélérez les workloads d’IA avec le modèle de déploiement Intel Gaudi 3 de votre choix et facilitez le travail des développeurs grâce à des modèles open source sur un cloud public à normes ouvertes.

Déployez en fonction de votre infrastructure et de vos exigences logicielles

Les accélérateurs d’IA Intel Gaudi 3 sont associés aux processeurs Intel Xeon de 5e génération sur IBM Cloud Virtual Servers for VPC.

Mettez à disposition un serveur autonome sur IBM Cloud Virtual Private Cloud (VPC)

Les accélérateurs d’IA Intel Gaudi 3 peuvent être déployés via des instances cloud d’IBM Cloud Virtual Servers for VPC. IBM Cloud VPC est conçu pour une résilience et une sécurité élevées au sein d’un réseau défini par logiciel, où les clients peuvent créer des clouds privés isolés tout en conservant les avantages essentiels du cloud public. L’instance cloud Intel Gaudi 3, qui prend également en charge les images Red Hat Enterprise Linux AI, est idéale pour les clients disposant d’une pile logicielle hautement spécialisée, ou pour ceux qui ont besoin d’un contrôle total sur leur serveur sous-jacent.

Découvrir le déploiement de serveurs
La différence réside dans le design
Mémoire à large bande passante (HBM)

Accélérez les performances de l’IA générative et créez avec davantage de tokens et de modèles sur une seule carte offrant 128 Go de capacité HBM et une vitesse de bande passante de 3,7 To/s.

Ethernet standard

Éliminez le verrouillage de la structure et réduisez les coûts d’intégration tout en élargissant votre choix de commutation grâce à l’Ethernet standard.

 

Transmission de données haute capacité

Bénéficiez d’une capacité d’évolutivité horizontale et évolutive massive avec 24 ports 200 GbE de RoCE haute capacité.

Développement ouvert

Simplifiez le développement avec l’extension Intel Gaudi 3 pour PyTorch et réduisez le temps de développement et la maintenance du code grâce à une bibliothèque de modèles optimisée sur Hugging Face.

Haute performance des cœurs

Profitez du moteur de multiplication matricielle des accélérateurs d’IA Intel Gaudi 3, doté de cœurs spécialisés hautes performances conçus pour réduire les transferts de données.

Migration simplifiée

Migrez vos modèles en mode lift and shift avec seulement trois lignes de code sur un logiciel ouvert à l’aide d’outils de développement intuitifs.

Ressources
Documents Intel Gaudi 3
Lancez-vous avec les accélérateurs d’IA Intel Gaudi 3 sur IBM Cloud. Explorez les guides de provisionnement, les tutoriels de démarrage, les informations de profil et autres ressources.
Un motif bleu et blanc avec des cercles.
Documents IBM Cloud VPC
En savoir plus sur IBM Cloud Virtual Private Cloud. Explorez les guides de provisionnement, les tutoriels de démarrage et autres ressources.
Illustration abstraite représentant un globe
Démo IBM watsonx.ai
Visite guidée du studio de développement watsonx.ai Découvrez comment créer des prompts, expérimenter des modèles de fondation et créer des modèles de ML.
Découvrez le partenariat en action avec cet aperçu des coulisses d'Intel Gaudi 3 sur IBM Cloud
Programmeur informatique professionnel travaillant dans un centre de données sur un ordinateur de bureau avec trois écrans, effectuant le développement de logiciels et de matériel. Les écrans montrent la blockchain et le concept d’architecture du réseau de données
Infographie Intel Gaudi 3
Affichez et téléchargez des informations rapides sur Intel Gaudi 3 sur IBM Cloud
Gros plan sur les mains d’une personne tapant sur le clavier rétroéclairé d’un ordinateur de bureau. Écrans affichent l’interface utilisateur du langage de codage Ingénieur logiciel créant une application e-commerce innovante Développement de programmes
Infographie Intel et IBM Cloud : l’accord parfait
Consultez et téléchargez des informations rapides sur tous les produits et services liés aux partenariats proposés sur IBM Cloud

Foire aux questions

Conçus pour les workloads d’IA hautes performances, les accélérateurs d’IA Intel Gaudi 3 sur IBM Cloud sont dotés de 64 cœurs de processeur Tensor (TPC) et de huit moteurs de multiplication matricielle (MME) pour accélérer les calculs de réseaux neuronaux profonds. Les accélérateurs d’IA Intel Gaudi 3 sur IBM Cloud sont également équipés de 128 Go de mémoire HBM2E et offrent jusqu’à 3,7 To/s de bande passante mémoire, et prennent en charge la mise en réseau Ethernet standard avec 24 ports 200 GbE, fournissant 9,6 Tbit/s de bande passante bidirectionnelle pour une interconnectivité système évolutive.

Les accélérateurs d’IA Intel Gaudi 3 prennent en charge de nombreuses applications d’IA, notamment l’inférence, la classification, l’analyse des sentiments et la génération de contenus (texte, image, vidéo, résumés et questions-réponses), axées sur les grands modèles de langage (LLM), les modèles multimodaux et la génération augmentée par récupération (RAG).

Avec 128 Go de mémoire HBM2E et jusqu’à 3,7 To/s de bande passante mémoire, les accélérateurs d’IA Intel Gaudi 3 sur IBM Cloud permettent d’assurer un débit de données rapide, de réduire les goulets d’étranglement et de permettre aux développeurs de traiter des ensembles de données volumineux plus rapidement et plus efficacement.

Les accélérateurs d’IA Intel Gaudi 3 sur IBM Cloud sont intégrés à IBM Cloud Virtual Servers sur IBM Cloud Virtual Private Cloud (VPC). IBM Cloud VPC est un réseau défini par logiciel (SDN) hautement résilient et sécurisé sur lequel vous pouvez créer des clouds privés isolés tout en conservant les avantages essentiels du cloud public. Le profil de serveur virtuel Intel Gaudi 3 sur IBM Cloud VPC est une combinaison préconfigurée de vCPU, de RAM et de stockage permettant de démarrer rapidement une instance de serveur virtuel.

Les accélérateurs d’IA Intel Gaudi 3 sur IBM Cloud prennent en charge les frameworks populaires comme PyTorch, ONNX et DeepSpeed. Plus de 400 000 modèles sont disponibles sur Hugging Face, optimisés pour une utilisation avec la bibliothèque logicielle Optimum Habana. La suite logicielle complète Intel Gaudi et la prise en charge des frameworks sont conçues pour faciliter la migration, permettant aux développeurs d’intégrer les modèles existants avec des modifications de code minimales.

 

Produits associés Red Hat OpenShift on IBM Cloud
Créez votre propre cluster d’hôtes de calcul Red Hat OpenShift pour déployer et gérer des applications conteneurisées sur des serveurs virtuels IBM Cloud, sur des serveurs bare metal, ou sur votre propre matériel ou cloud tiers à l’aide d’IBM Cloud Satellite.
IBM watsonx
Découvrez un portefeuille complet de produits d’IA qui accélèrent l’impact de l’IA générative dans les principaux workflows pour stimuler la productivité.
IBM Cloud Kubernetes Service
Choisissez une solution Kubernetes certifiée et gérée, conçue pour créer un cluster d’hôtes de calcul et déployer des applications conteneurisées sur IBM Cloud. IBM gère le serveur maître, ce qui vous libère du système d’exploitation hôte, de l’exécution et des processus de mise à jour.
Architectures déployables sur IBM Cloud
Déployez facilement vos applications et systèmes dans divers environnements grâce à un ensemble préconfiguré de code d’infrastructure (IaC) pour un déploiement transparent qui permet aux développeurs et aux équipes opérationnelles de déployer rapidement de nouvelles fonctionnalités et mises à jour système.
Modèle de génération augmentée de récupération (RAG) sur IBM Cloud
Automatisez le déploiement de la RAG avec les services IBM Cloud et watsonx, et intégrez vos données d’entreprise dans des solutions d’IA générative.
IBM Cloud Virtual Servers for VPC
Machines virtuelles hautement évolutives, pour un ou plusieurs locataires, que vous pouvez démarrer rapidement pour un isolement et un contrôle maximum du réseau.
Passez à l’étape suivante

Découvrez les accélérateurs d’IA Intel Gaudi 3 sur IBM Cloud.

  1. Configuration, tarifs, devis
  2. Lire la documentation