Intel Gaudi 3 KI-Beschleuniger in der IBM Cloud

Der leistungsstarke, kostengünstige und offene KI-Beschleuniger für generative KI-Workloads.

Nahansicht von Gaudi 3 mit 64 Tensor-Prozessorkernen (TPCs) und acht Matrix-Multiplikations-Engines (MMEs)
IBM Cloud ist der erste globale Cloud-Service-Provider, der Intel Gaudi 3 liefert

Schalten Sie neue KI-Lösungen in der IBM Cloud frei, gestalten Sie diese innovativ und stellen Sie sie bereit – mit Intel Gaudi 3 KI-Beschleunigern, entwickelt, um Ihnen eine kosteneffiziente Skalierung für die KI-Anforderungen von Unternehmen mit hoher Leistung, Flexibilität bei der Bereitstellung und offener Entwicklung zu ermöglichen.   

Unterstützt eine breite Palette von generativen AI-Inferencing-Anwendungen und Frameworks, einschließlich Large Language Models (LLM) und multimodaler Modelle (MMM). Beginnen Sie schnell mit der Bereitstellung von IBM Cloud Virtual Servers for VPC. Die Unterstützung für IBM watsonx, Red Hat OpenShift Kubernetes Service und eine automatisierte Terraform-basierte Bereitstellung sind für das erste Halbjahr 2025 geplant. Die Unterstützung für Red Hat OpenShift KI-Cluster, IBM Cloud Kubernetes Service und einsatzfähige Architekturen in der IBM Cloud ist für das zweite Halbjahr 2025 geplant.Mehr erfahren über Intel Gaudi 3 Technologie

Eine neue Lösung für unternehmenstaugliche KI
Grafiken und Diagramme auf einer klaren Hintergrundillustration
Wettbewerbsfähige Preise und Leistung für KI

Profitieren Sie von einer kostengünstigen generativen KI-Leistung für einen hohen Inferencing-Durchsatz und optimierte Gesamtbetriebskosten.

 

Abbildung eines Cloudsymbols, das Dokumente, Prozesse und integrierte Illustrationen darstellt
Schnelle, effiziente Skalierung

Erhöhen Sie die Skalierbarkeit Ihres Systems mit flexibler Kapazitätsunterstützung und unabhängig von geschlossenen Systemen.

Abbildung einer Anwendung, die eine Vielzahl von Farben in verschiedenen Abschnitten und Funktionen anzeigt
Offene Entwicklung, Wahl bei der Bereitstellung

Beschleunigen Sie KI-Workloads mit dem Intel Gaudi 3-Bereitstellungsmodell Ihrer Wahl und helfen Sie, Entwicklerbarrieren mit Open Source-Modellen in einer Public Cloud mit offenen Standards zu beseitigen.

Bereitstellung basierend auf Ihren Infrastruktur- und Softwareanforderungen

Intel Gaudi 3 KI-Beschleuniger sind mit Intel Xeon Prozessoren der 5. Generation auf IBM Cloud Virtual Servers for VPC gepaart.

Nahansicht von Gaudi 3 mit 64 Tensor-Prozessorkernen (TPCs) und acht Matrix-Multiplikations-Engines (MMEs)
Bereitstellung eines eigenständigen Servers in der IBM Cloud Virtual Private Cloud (VPC)

Intel Gaudi 3 KI-Beschleuniger können über IBM Cloud Virtual Servers for VPC-Cloudinstanzen bereitgestellt werden. IBM Cloud VPC ist für hohe Resilienz und Sicherheit in einem softwaredefinierten Netzwerk konzipiert, in dem Kunden isolierte Private Clouds erstellen können, ohne auf die wesentlichen Vorteile einer Public Cloud verzichten zu müssen. Die Cloud-Instanz Intel Gaudi 3, die auch Red Hat Enterprise Linux AI-Images unterstützt, ist ideal für Kunden mit hochspezialisierten Software-Stacks oder für solche, die volle Kontrolle über ihren zugrunde liegenden Server benötigen.

Serverbereitstellung erkunden
Der Unterschied liegt im Design
Speicher mit hoher Bandbreite (HBM)

Beschleunigen Sie die Leistung der generativen KI und bauen Sie mit mehr Token und mehr Modellen auf einer einzigen Karte mit 128 GB HBM-Kapazität bei einer Bandbreitengeschwindigkeit von 3,7 TB/s auf.

Branchenstandard Ethernet

Eliminieren Sie Fabric-Lock-in und senken Sie die Integrationskosten, während Sie gleichzeitig mehr Auswahl an Switches mit Ethernet nach Branchenstandard haben.

 

Datenübertragung mit hoher Kapazität

Profitieren Sie von enormer Skalierung der Kapazität mit 24 x 200 GbE-Ports mit hoher Kapazität und RoCE.

Offene Entwicklung

Vereinfachen Sie die Entwicklung mit der Intel Gaudi 3 Extension for PyTorch und reduzieren Sie die Entwicklungszeit und Code-Wartung mit einer optimierten Modellbibliothek auf Hugging Face.

Hohe Kernleistung

Nutzen Sie die Intel Gaudi 3 AI Accelerator Matrix Multiplication Engine mit speziellen Hochleistungs-Kernen, die für weniger Datenübertragungen konzipiert sind.

Vereinfachte Migration

Lift-and-Shift-Modelle mit nur drei Codezeilen auf offener Software mit benutzerfreundlichen Developer Tools.

Häufig gestellte Fragen

Intel Gaudi 3 KI-Beschleuniger in der IBM Cloud sind für leistungsstarke KI-Workloads konzipiert. Sie verfügen über 64 Tensor Processor Cores (TPCs) und acht Matrix Multiplication Engines (MMEs), um tiefgreifende Berechnungen in neuronalen Netzen zu beschleunigen. Intel Gaudi 3 KI-Beschleuniger in der IBM Cloud sind außerdem mit 128 GB HBM2E-Speicher ausgestattet und bieten eine Speicherbandbreite von bis zu 3,7 TB/s und unterstützen branchenübliche Ethernet-Netzwerke mit 24 x 200 GbE-Ports, die eine bidirektionale Bandbreite von 9,6 Tbit/s für eine skalierbare Systeminterkonnektivität bieten.

Intel Gaudi 3 KI-Beschleuniger bieten eine umfassende Unterstützung für KI-Anwendungen, einschließlich Inferenz, 3D-Generierung, Textgenerierung, Klassifizierung, Videogenerierung, Stimmung, Übersetzung, Bildgenerierung, Zusammenfassung sowie Fragen und Antworten (Q&A) – mit Schwerpunkt auf multimodalen großen Sprachmodellen (LLM) und Retrieval-Augmented Generation (RAG).

Mit 128 GB HBM2E-Speicher und einer Speicherbandbreite von bis zu 3,7 TB/s tragen die Intel Gaudi 3 KI-Beschleuniger in der IBM Cloud dazu bei, einen schnellen Datendurchsatz zu gewährleisten, Engpässe zu reduzieren und Entwicklern eine schnellere und effizientere Verarbeitung von großen Datensätzen zu ermöglichen.

Intel Gaudi 3 KI-Beschleuniger in der IBM Cloud sind in IBM Cloud Virtual Servers in der IBM Cloud Virtual Private Cloud (VPC) integriert. Die IBM Cloud VPC ist ein äußerst stabiles und sicheres Software-definiertes Netzwerk (SDN), auf dem Sie isolierte Private Clouds aufbauen können, während Sie die wesentlichen Vorteile der Public Cloud beibehalten. Das Intel Gaudi 3 virtuelle Serverprofil auf IBM Cloud VPC ist eine vorkonfigurierte Kombination aus vCPU, RAM und Speicher zum schnellen Starten einer virtuellen Serverinstanz.

Intel Gaudi 3 KI- Beschleuniger in der IBM Cloud unterstützen beliebte Frameworks wie PyTorch, ONNX und DeepSpeed. Auf Hugging Face sind über 400.000 Modelle verfügbar, die für die Verwendung mit der Optimum Habana Softwarebibliothek optimiert sind. Die vollständige Unterstützung der Intel Gaudi Software-Suite und des Frameworks soll die Migration erleichtern und Entwicklern die Integration vorhandener Modelle mit minimalen Codeänderungen ermöglichen.

 

Ähnliche Produkte Red Hat OpenShift on IBM Cloud
Erstellen Sie Ihren eigenen Red Hat OpenShift-Cluster an Compute-Hosts, um containerisierte Apps auf IBM Cloud Virtual Servers, Bare Metal Servers oder auf Ihrer eigenen Hardware oder in der Cloud eines Drittanbieters mithilfe von IBM Cloud Satellite bereitzustellen und zu verwalten.
IBM watsonx
Erkunden Sie ein vollständiges Portfolio von KI-Produkten, die die Wirkung generativer KI in Kern-Workflows beschleunigen und damit die Produktivität steigern.
IBM Cloud Kubernetes Service
Wählen Sie eine zertifizierte, verwaltete Kubernetes-Lösung, die für die Erstellung eines Clusters an Compute-Hosts entwickelt wurde, um containerisierte Anwendungen in der IBM Cloud bereitzustellen. IBM verwaltet den Master und befreit Sie von Host-Betriebssystem-, Laufzeit- und Versions-Aktualisierungsprozessen.
Einsatzfähige Architekturen in der IBM Cloud
Stellen Sie Ihre Anwendungen und Systeme ganz einfach in verschiedenen Umgebungen bereit, mit einem vorkonfigurierten Satz Infrastrukturcode (IaC) für eine nahtlose Bereitstellung, die es Entwicklern und Betriebsteams erleichtert, neue Funktionen und Systemupdates schnell bereitzustellen.
Retrieval-Augmented Generation (RAG)-Muster in der IBM Cloud
Automatisieren Sie die RAG-Bereitstellung mit den unterstützenden Diensten IBM Cloud und watsonx und betten Sie Ihre Unternehmensdaten in generative KI-Lösungen ein.
IBM Cloud Virtual Server for VPC
Hoch skalierbare, Single-Tenant- und Multi-Tenant-Virtual-Maschinen für maximale Netzwerkisolation und -kontrolle.
Machen Sie den nächsten Schritt

Erkunden Sie Intel Gaudi 3 KI-Beschleuniger in der IBM Cloud.

Konfiguration, Preis, Angebot Dokumentation durchsuchen