Intel Gaudi 3 KI-Beschleuniger in der IBM Cloud

IBM Cloud ist der erste globale Cloud-Service-Provider, der Intel Gaudi 3 liefert

Schalten Sie neue KI-Lösungen in der IBM Cloud frei, gestalten Sie diese innovativ und stellen Sie sie bereit – mit Intel Gaudi 3 KI-Beschleunigern, entwickelt, um Ihnen eine kosteneffiziente Skalierung für die KI-Anforderungen von Unternehmen mit hoher Leistung, Flexibilität bei der Bereitstellung und offener Entwicklung zu ermöglichen.

Unterstützt eine breite Palette von generativen AI-Inferencing-Anwendungen und Frameworks, einschließlich Large Language Models (LLM) und multimodaler Modelle (MMM). Starten Sie schnell mit IBM Cloud Virtual Servers for VPC oder Red Hat OpenShift Kubernetes Service. Unterstützung für IBM^® watsonx, Red Hat OpenShift KI-Cluster, IBM Cloud Kubernetes Service, einsatzfähige Architekturen in der IBM Cloud und eine automatisierte Terraform-basierte Bereitstellung sind für das 2. Halbjahr 2025 geplant.

Mehr erfahren über Intel Gaudi 3 Technologie

Ankündigungen

Eine neue Lösung für unternehmenstaugliche KI

Grafiken und Diagramme auf einer klaren Hintergrundillustration

Wettbewerbsfähige Preise und Leistung für KI

Profitieren Sie von einer kostengünstigen generativen KI-Leistung für einen hohen Inferencing-Durchsatz und optimierte Gesamtbetriebskosten.

Abbildung eines Cloudsymbols, das Dokumente, Prozesse und integrierte Illustrationen darstellt

Schnelle, effiziente Skalierung

Erhöhen Sie die Skalierbarkeit Ihres Systems mit flexibler Kapazitätsunterstützung und unabhängig von geschlossenen Systemen.

Anwendung, die eine Vielzahl von Farben in verschiedenen Abschnitten und Funktionen anzeigt

Offene Entwicklung, Wahl bei der Bereitstellung

Beschleunigen Sie KI-Workloads mit dem Intel Gaudi 3-Bereitstellungsmodell Ihrer Wahl und helfen Sie, Entwicklerbarrieren mit Open Source-Modellen in einer Public Cloud mit offenen Standards zu beseitigen.

Bereitstellung basierend auf Ihren Infrastruktur- und Softwareanforderungen

Intel Gaudi 3 KI-Beschleuniger sind mit Intel Xeon Prozessoren der 5. Generation auf IBM Cloud Virtual Servers for VPC gepaart.

Nahansicht von Gaudi 3 mit 64 Tensor-Prozessorkernen (TPCs) und acht Matrix-Multiplikations-Engines (MMEs)

Bereitstellung eines eigenständigen Servers in der IBM Cloud Virtual Private Cloud (VPC)

Intel Gaudi 3 KI-Beschleuniger können über IBM Cloud Virtual Servers for VPC-Cloudinstanzen bereitgestellt werden. IBM Cloud VPC ist für hohe Resilienz und Sicherheit in einem softwaredefinierten Netzwerk konzipiert, in dem Kunden isolierte Private Clouds erstellen können, ohne auf die wesentlichen Vorteile einer Public Cloud verzichten zu müssen. Die Cloud-Instanz Intel Gaudi 3, die auch Red Hat Enterprise Linux AI-Images unterstützt, ist ideal für Kunden mit hochspezialisierten Software-Stacks oder für solche, die volle Kontrolle über ihren zugrunde liegenden Server benötigen.

Serverbereitstellung erkunden

Der Unterschied liegt im Design

Speicher mit hoher Bandbreite (HBM)

Beschleunigen Sie die Leistung der generativen KI und bauen Sie mit mehr Token und mehr Modellen auf einer einzigen Karte mit 128 GB HBM-Kapazität bei einer Bandbreitengeschwindigkeit von 3,7 TB/s auf.

Branchenstandard Ethernet

Eliminieren Sie Fabric-Lock-in und senken Sie die Integrationskosten, während Sie gleichzeitig mehr Auswahl an Switches mit Ethernet nach Branchenstandard haben.

Datenübertragung mit hoher Kapazität

Profitieren Sie von enormer Skalierung der Kapazität mit 24 x 200 GbE-Ports mit hoher Kapazität und RoCE.

Offene Entwicklung

Vereinfachen Sie die Entwicklung mit der Intel Gaudi 3 Extension for PyTorch und reduzieren Sie die Entwicklungszeit und Code-Wartung mit einer optimierten Modellbibliothek auf Hugging Face.

Hohe Kernleistung

Nutzen Sie die IntelGaudi 3 AI Accelerator Matrix Multiplication Engine mit speziellen Hochleistungs-Kernen, die für weniger Datenübertragungen konzipiert sind.

Vereinfachte Migration

Lift-and-Shift-Modelle mit nur drei Codezeilen auf offener Software mit benutzerfreundlichen Developer Tools.

Ressourcen

Intel Gaudi 3-Dokumente

Erste Schritte mit Intel Gaudi 3 KI-Beschleunigern auf IBM Cloud. Erkunden Sie Anleitungen zur Bereitstellung, Tutorials für den Einstieg, Profildetails und mehr.

IBM Cloud VPC-Dokumente

Mehr über IBM Cloud Virtual Private Cloud erfahren. Erkunden Sie Anleitungen zur Bereitstellung, Tutorials für den Einstieg und mehr.

Demo zu IBM watsonx.ai

Machen Sie eine Tour durch das watsonx.ai Entwicklerstudio. Erfahren Sie, wie Sie Prompts erstellen, mit Foundation-Modellen experimentieren und ML-Modelle erstellen.

Erleben Sie die Partnerschaft in Aktion mit diesem Blick hinter die Kulissen von Intel Gaudi 3 auf IBM Cloud

Ein professioneller IT-Programmierer arbeitet im Rechenzentrum an einem Desktop-Computer mit drei Bildschirmen und entwickelt Software und Hardware. Die Bildschirme zeigen Blockchain und Data Network Architecture Concept

Infografik zu Intel Gaudi 3

Erkenntnisse zu Intel Gaudi 3 auf IBM Cloud ansehen und herunterladen

Nahaufnahme mit Fokus auf die Hände einer Person, die auf der beleuchteten Tastatur eines Desktop-Computers tippt. Auf den Bildschirmen wird die Benutzeroberfläche der Codierung angezeigt. Softwareentwickler erstellen innovative E-Commerce-App. Programmentwicklung

Intel und IBM Cloud: Infografik Gemeinsam mehr erreichen

Sehen Sie sich schnelle Erkenntnisse zu allen partnerschaftsbezogenen Produkten und Services, die auf IBM Cloud bereitgestellt werden, an und laden Sie sie herunter

Häufig gestellte Fragen

Intel Gaudi 3 KI-Beschleuniger in der IBM Cloud sind für leistungsstarke KI-Workloads konzipiert. Sie verfügen über 64 Tensor Processor Cores (TPCs) und acht Matrix Multiplication Engines (MMEs), um tiefgreifende Berechnungen in neuronalen Netzen zu beschleunigen. Intel Gaudi 3 KI-Beschleuniger in der IBM Cloud sind außerdem mit 128 GB HBM2E-Speicher ausgestattet und bieten eine Speicherbandbreite von bis zu 3,7 TB/s und unterstützen branchenübliche Ethernet-Netzwerke mit 24 x 200 GbE-Ports, die eine bidirektionale Bandbreite von 9,6 Tbit/s für eine skalierbare Systeminterkonnektivität bieten.

Intel Gaudi 3 KI-Beschleuniger bieten eine umfassende Unterstützung für KI-Anwendungen, einschließlich Inferenz, 3D-Generierung, Textgenerierung, Klassifizierung, Videogenerierung, Stimmung, Übersetzung, Bildgenerierung, Zusammenfassung sowie Fragen und Antworten (Q&A) – mit Schwerpunkt auf multimodalen großen Sprachmodellen (LLM) und Retrieval-Augmented Generation (RAG).

Mit 128 GB HBM2E-Speicher und einer Speicherbandbreite von bis zu 3,7 TB/s tragen die Intel Gaudi 3 KI-Beschleuniger in der IBM Cloud dazu bei, einen schnellen Datendurchsatz zu gewährleisten, Engpässe zu reduzieren und Entwicklern eine schnellere und effizientere Verarbeitung von großen Datensätzen zu ermöglichen.

Intel Gaudi 3 KI-Beschleuniger in der IBM Cloud sind in IBM Cloud Virtual Servers in der IBM Cloud Virtual Private Cloud (VPC) integriert. Die IBM Cloud VPC ist ein äußerst stabiles und sicheres Software-definiertes Netzwerk (SDN), auf dem Sie isolierte Private Clouds aufbauen können, während Sie die wesentlichen Vorteile der Public Cloud beibehalten. Das Intel Gaudi 3 virtuelle Serverprofil auf IBM Cloud VPC ist eine vorkonfigurierte Kombination aus vCPU, RAM und Speicher zum schnellen Starten einer virtuellen Serverinstanz.

Intel Gaudi 3 KI- Beschleuniger in der IBM Cloud unterstützen beliebte Frameworks wie PyTorch, ONNX und DeepSpeed. Auf Hugging Face sind über 400.000 Modelle verfügbar, die für die Verwendung mit der Optimum Habana Softwarebibliothek optimiert sind. Die vollständige Unterstützung der Intel Gaudi Software-Suite und des Frameworks soll die Migration erleichtern und Entwicklern die Integration vorhandener Modelle mit minimalen Codeänderungen ermöglichen.

Ähnliche Produkte

Red Hat OpenShift on IBM Cloud

Erstellen Sie Ihren eigenen Red Hat OpenShift-Cluster an Compute-Hosts, um containerisierte Apps auf IBM Cloud Virtual Servers, Bare Metal Servers oder auf Ihrer eigenen Hardware oder in der Cloud eines Drittanbieters mithilfe von IBM Cloud Satellite bereitzustellen und zu verwalten.

IBM watsonx

Erkunden Sie ein vollständiges Portfolio von KI-Produkten, die die Wirkung generativer KI in Kern-Workflows beschleunigen und damit die Produktivität steigern.

IBM Cloud Kubernetes Service

Wählen Sie eine zertifizierte, verwaltete Kubernetes-Lösung, die für die Erstellung eines Clusters an Compute-Hosts entwickelt wurde, um containerisierte Anwendungen in der IBM Cloud bereitzustellen. IBM verwaltet den Master und befreit Sie von Host-Betriebssystem-, Laufzeit- und Versions-Aktualisierungsprozessen.

Einsatzfähige Architekturen in der IBM Cloud

Stellen Sie Ihre Anwendungen und Systeme ganz einfach in verschiedenen Umgebungen bereit, mit einem vorkonfigurierten Satz Infrastrukturcode (IaC) für eine nahtlose Bereitstellung, die es Entwicklern und Betriebsteams erleichtert, neue Funktionen und Systemupdates schnell bereitzustellen.

Retrieval-Augmented Generation (RAG)-Muster in der IBM Cloud

Automatisieren Sie die RAG-Bereitstellung mit den unterstützenden Diensten IBM Cloud und watsonx und betten Sie Ihre Unternehmensdaten in generative KI-Lösungen ein.

IBM Cloud Virtual Server for VPC