Der leistungsstarke, kostengünstige und offene KI-Beschleuniger für generative KI-Workloads.
Schalten Sie neue KI-Lösungen in der IBM Cloud frei, gestalten Sie diese innovativ und stellen Sie sie bereit – mit Intel Gaudi 3 KI-Beschleunigern, entwickelt, um Ihnen eine kosteneffiziente Skalierung für die KI-Anforderungen von Unternehmen mit hoher Leistung, Flexibilität bei der Bereitstellung und offener Entwicklung zu ermöglichen.
Unterstützt eine breite Palette von generativen AI-Inferencing-Anwendungen und Frameworks, einschließlich Large Language Models (LLM) und multimodaler Modelle (MMM). Beginnen Sie schnell mit der Bereitstellung von IBM Cloud Virtual Servers for VPC. Die Unterstützung für IBM watsonx, Red Hat OpenShift Kubernetes Service und eine automatisierte Terraform-basierte Bereitstellung sind für das erste Halbjahr 2025 geplant. Die Unterstützung für Red Hat OpenShift KI-Cluster, IBM Cloud Kubernetes Service und einsatzfähige Architekturen in der IBM Cloud ist für das zweite Halbjahr 2025 geplant.Mehr erfahren über Intel Gaudi 3 Technologie
Intel Gaudi 3 KI-Beschleuniger sind mit Intel Xeon Prozessoren der 5. Generation auf IBM Cloud Virtual Servers for VPC gepaart.
Intel Gaudi 3 KI-Beschleuniger können über IBM Cloud Virtual Servers for VPC-Cloudinstanzen bereitgestellt werden. IBM Cloud VPC ist für hohe Resilienz und Sicherheit in einem softwaredefinierten Netzwerk konzipiert, in dem Kunden isolierte Private Clouds erstellen können, ohne auf die wesentlichen Vorteile einer Public Cloud verzichten zu müssen. Die Cloud-Instanz Intel Gaudi 3, die auch Red Hat Enterprise Linux AI-Images unterstützt, ist ideal für Kunden mit hochspezialisierten Software-Stacks oder für solche, die volle Kontrolle über ihren zugrunde liegenden Server benötigen.
Intel Gaudi 3 KI-Beschleuniger in der IBM Cloud sind für leistungsstarke KI-Workloads konzipiert. Sie verfügen über 64 Tensor Processor Cores (TPCs) und acht Matrix Multiplication Engines (MMEs), um tiefgreifende Berechnungen in neuronalen Netzen zu beschleunigen. Intel Gaudi 3 KI-Beschleuniger in der IBM Cloud sind außerdem mit 128 GB HBM2E-Speicher ausgestattet und bieten eine Speicherbandbreite von bis zu 3,7 TB/s und unterstützen branchenübliche Ethernet-Netzwerke mit 24 x 200 GbE-Ports, die eine bidirektionale Bandbreite von 9,6 Tbit/s für eine skalierbare Systeminterkonnektivität bieten.
Intel Gaudi 3 KI-Beschleuniger bieten eine umfassende Unterstützung für KI-Anwendungen, einschließlich Inferenz, 3D-Generierung, Textgenerierung, Klassifizierung, Videogenerierung, Stimmung, Übersetzung, Bildgenerierung, Zusammenfassung sowie Fragen und Antworten (Q&A) – mit Schwerpunkt auf multimodalen großen Sprachmodellen (LLM) und Retrieval-Augmented Generation (RAG).
Mit 128 GB HBM2E-Speicher und einer Speicherbandbreite von bis zu 3,7 TB/s tragen die Intel Gaudi 3 KI-Beschleuniger in der IBM Cloud dazu bei, einen schnellen Datendurchsatz zu gewährleisten, Engpässe zu reduzieren und Entwicklern eine schnellere und effizientere Verarbeitung von großen Datensätzen zu ermöglichen.
Intel Gaudi 3 KI-Beschleuniger in der IBM Cloud sind in IBM Cloud Virtual Servers in der IBM Cloud Virtual Private Cloud (VPC) integriert. Die IBM Cloud VPC ist ein äußerst stabiles und sicheres Software-definiertes Netzwerk (SDN), auf dem Sie isolierte Private Clouds aufbauen können, während Sie die wesentlichen Vorteile der Public Cloud beibehalten. Das Intel Gaudi 3 virtuelle Serverprofil auf IBM Cloud VPC ist eine vorkonfigurierte Kombination aus vCPU, RAM und Speicher zum schnellen Starten einer virtuellen Serverinstanz.
Intel Gaudi 3 KI-
Beschleuniger in der IBM Cloud unterstützen beliebte Frameworks wie
PyTorch, ONNX und DeepSpeed. Auf Hugging Face sind über 400.000 Modelle verfügbar, die für die Verwendung mit der
Optimum Habana Softwarebibliothek optimiert sind. Die vollständige Unterstützung der Intel Gaudi
Software-Suite und des Frameworks soll die Migration erleichtern
und Entwicklern die Integration vorhandener Modelle mit minimalen Codeänderungen ermöglichen.