L’accélérateur d’IA puissant, rentable et ouvert pour les workloads d’IA générative.
Découvrez, innovez et déployez de nouvelles solutions d’IA avec les accélérateurs d’IA Intel Gaudi 3 sur IBM Cloud, conçus pour vous aider à répondre de manière rentable aux exigences des entreprises en matière d’IA avec des performances élevées, une flexibilité de déploiement et un développement ouvert.
Prenez en charge un large éventail d’applications et de frameworks d’inférence pour l’IA générative, y compris les grands modèles de langage (LLM) et les modèles multimodaux (MMM). Démarrez rapidement avec IBM Cloud Virtual Server for VPC ou Red Hat OpenShift Kubernetes Service. La prise en charge d’IBM watsonx, des clusters d’IA Red Hat OpenShift, d’IBM Cloud Kubernetes Service, des architectures déployables sur IBM Cloud et d’un déploiement automatisé basé sur Terraform est prévue pour le deuxième semestre 2025.
En savoir plus sur la technologie Intel Gaudi 3
Les accélérateurs d’IA Intel Gaudi 3 sont associés aux processeurs Intel Xeon de 5e génération sur IBM Cloud Virtual Servers for VPC.
Les accélérateurs d’IA Intel Gaudi 3 peuvent être déployés via des instances cloud d’IBM Cloud Virtual Servers for VPC. IBM Cloud VPC est conçu pour une résilience et une sécurité élevées au sein d’un réseau défini par logiciel, où les clients peuvent créer des clouds privés isolés tout en conservant les avantages essentiels du cloud public. L’instance cloud Intel Gaudi 3, qui prend également en charge les images Red Hat Enterprise Linux AI, est idéale pour les clients disposant d’une pile logicielle hautement spécialisée, ou pour ceux qui ont besoin d’un contrôle total sur leur serveur sous-jacent.
Conçus pour les workloads d’IA hautes performances, les accélérateurs d’IA Intel Gaudi 3 sur IBM Cloud sont dotés de 64 cœurs de processeur Tensor (TPC) et de huit moteurs de multiplication matricielle (MME) pour accélérer les calculs de réseaux neuronaux profonds. Les accélérateurs d’IA Intel Gaudi 3 sur IBM Cloud sont également équipés de 128 Go de mémoire HBM2E et offrent jusqu’à 3,7 To/s de bande passante mémoire, et prennent en charge la mise en réseau Ethernet standard avec 24 ports 200 GbE, fournissant 9,6 Tbit/s de bande passante bidirectionnelle pour une interconnectivité système évolutive.
Les accélérateurs d’IA Intel Gaudi 3 prennent en charge de nombreuses applications d’IA, notamment l’inférence, la classification, l’analyse des sentiments et la génération de contenus (texte, image, vidéo, résumés et questions-réponses), axées sur les grands modèles de langage (LLM), les modèles multimodaux et la génération augmentée par récupération (RAG).
Avec 128 Go de mémoire HBM2E et jusqu’à 3,7 To/s de bande passante mémoire, les accélérateurs d’IA Intel Gaudi 3 sur IBM Cloud permettent d’assurer un débit de données rapide, de réduire les goulets d’étranglement et de permettre aux développeurs de traiter des ensembles de données volumineux plus rapidement et plus efficacement.
Les accélérateurs d’IA Intel Gaudi 3 sur IBM Cloud sont intégrés à IBM Cloud Virtual Servers sur IBM Cloud Virtual Private Cloud (VPC). IBM Cloud VPC est un réseau défini par logiciel (SDN) hautement résilient et sécurisé sur lequel vous pouvez créer des clouds privés isolés tout en conservant les avantages essentiels du cloud public. Le profil de serveur virtuel Intel Gaudi 3 sur IBM Cloud VPC est une combinaison préconfigurée de vCPU, de RAM et de stockage permettant de démarrer rapidement une instance de serveur virtuel.
Les accélérateurs d’IA Intel Gaudi 3 sur IBM Cloud prennent en charge les frameworks populaires comme PyTorch, ONNX et DeepSpeed. Plus de 400 000 modèles sont disponibles sur Hugging Face, optimisés pour une utilisation avec la bibliothèque logicielle Optimum Habana. La suite logicielle complète Intel Gaudi et la prise en charge des frameworks sont conçues pour faciliter la migration, permettant aux développeurs d’intégrer les modèles existants avec des modifications de code minimales.