Intel® Gaudi® 3 AI Accelerators di IBM Cloud

Akselerator AI yang kuat, hemat biaya, dan terbuka untuk beban kerja AI generatif.

IBM Cloud adalah penyedia layanan cloud global pertama yang menghadirkan Intel® Gaudi® 3

Buka, berinovasi, dan terapkan solusi AI baru dengan akselerator AI Intel® Gaudi® 3 di IBM Cloud®—dirancang untuk membantu Anda meningkatkan skala yang menghemat biaya untuk kebutuhan AI perusahaan dengan kinerja tinggi, fleksibilitas dalam penerapan, dan pengembangan terbuka.   

Mendukung berbagai aplikasi dan kerangka kerja inferensi AI generatif, termasuk model bahasa besar (LLM) dan model multi-modal (MMM). Mulailah dengan cepat dengan IBM® Cloud Virtual Server untuk VPC atau Red Hat OpenShift Kubernetes Service. Dukungan untuk IBM® watsonx, klaster Red Hat OpenShift AI, IBM® Cloud Kubernetes Service, arsitektur yang dapat diterapkan pada IBM® Cloud, dan penerapan otomatis berbasis Terraform direncanakan pada paruh kedua tahun 2025.

Pelajari selengkapnya tentang teknologi Intel Gaudi 3

Solusi baru untuk AI perusahaan
Grafik dan bagan ditampilkan pada ilustrasi latar belakang yang bersih
Harga dan kinerja AI yang kompetitif

Dapatkan kinerja AI generatif yang hemat biaya untuk throughput inferensi yang tinggi dan biaya kepemilikan total yang dioptimalkan.

 

Ilustrasi terintegrasi ikon cloud yang menggambarkan dokumen, proses
Penskalaan yang cepat dan efisien

Tingkatkan skalabilitas sistem dengan mudah melalui dukungan kapasitas yang fleksibel dan kebebasan dari penguncian sistem tertutup.

Ilustrasi aplikasi menampilkan berbagai warna di berbagai bagian dan fitur
Pengembangan terbuka, pilihan dalam penerapan

Percepat beban kerja AI dengan model penerapan Intel Gaudi 3 pilihan Anda dan bantu menghilangkan hambatan pengembang dengan model sumber terbuka pada cloud publik standar terbuka.

Terapkan berdasarkan kebutuhan infrastruktur dan perangkat lunak Anda

Intel® Gaudi® 3 AI accelerators dipasangkan dengan prosesor Intel Xeon Generasi ke-5 pada IBM Cloud Virtual Server for VPC.

Menyediakan server mandiri di IBM Cloud Virtual Private Cloud (VPC)

Intel Gaudi 3 AI accelerators dapat diterapkan melalui IBM Cloud Virtual Server for VPC untuk instans cloud VPC. IBM Cloud VPC dirancang untuk ketahanan dan keamanan tinggi di dalam jaringan yang ditentukan perangkat lunak di mana klien dapat membangun cloud pribadi terisolasi sambil mempertahankan manfaat cloud publik yang penting. Instans cloud Intel Gaudi 3, yang juga mendukung gambar AI Red Hat Enterprise Linux, sangat ideal untuk klien dengan tumpukan perangkat lunak yang sangat khusus, atau mereka yang memerlukan kontrol penuh atas server yang mendasarinya.

Jelajahi penerapan server
Perbedaannya terletak pada desain
Memori bandwidth tinggi (HBM)

Percepat kinerja AI generatif dan bangun dengan lebih banyak token dan lebih banyak model pada satu kartu dengan kapasitas HBM 128 GB pada kecepatan bandwidth 3,7 TB/detik.

Ethernet standar industri

Hilangkan penguncian struktur dan bantu mengurangi biaya integrasi sekaligus meningkatkan pilihan Anda untuk beralih ke Ethernet standar industri.

 

Transmisi data berkapasitas tinggi

Dapatkan kapasitas skala besar dan peningkatan skala dengan port 24x 200 GbE RoCE berkapasitas tinggi.

Pengembangan terbuka

Sederhanakan pengembangan dengan Intel® Gaudi® 3 Extension untuk PyTorch dan bantu mengurangi waktu pengembangan dan pemeliharaan kode dengan pustaka model yang dioptimalkan pada Hugging Face.

Kinerja inti tinggi

Manfaatkan Akselerator AI Intel® Gaudi® 3 Matrix Multiplication Engine dengan core berkinerja tinggi khusus yang dirancang untuk transfer data yang lebih sedikit.

Migrasi yang disederhanakan

Model angkat dan geser dengan hanya tiga baris kode pada perangkat lunak terbuka dengan developer tools yang mudah digunakan.

Sumber daya
Dokumen Intel® Gaudi® 3
Mulailah dengan Intel® Gaudi® 3 AI accelerators di IBM Cloud. Jelajahi panduan penyediaan, tutorial memulai, detail profil, dan lainnya.
Desain berwarna biru dan putih dengan lingkaran.
Dokumen IBM Cloud VPC
Pelajari lebih lanjut tentang IBM Cloud Virtual Private Cloud. Jelajahi panduan penyediaan, tutorial memulai, dan banyak lagi.
Ilustrasi abstrak yang menggambarkan bola dunia
Demo IBM watsonx.ai
Ikuti tur studio pengembang watsonx.ai. Pelajari cara membuat prompt, bereksperimen dengan model dasar, dan membangun model ML.
Lihat kemitraan dalam aksi dengan tampilan di balik layar Intel Gaudi 3 di IBM® Cloud
Programer TI Profesional yang bekerja di Pusat Data pada Komputer Desktop dengan Tiga Layar, Melakukan Pengembangan Perangkat Lunak dan Perangkat Keras. Layar Menampilkan Blockchain, Konsep Arsitektur Jaringan Data
Infografis Intel Gaudi 3
Lihat dan unduh insight cepat ke Intel Gaudi 3 di IBM® Cloud
Fokus Jarak Dekat pada Tangan Orang yang Mengetik di Keyboard Backlit Komputer Desktop. Layar menampilkan antarmuka pengguna bahasa pengodean. Insinyur Perangkat Lunak Membuat Aplikasi e-Commerce yang Inovatif. Pengembangan Program
Intel dan IBM® Cloud: Infografis bersama yang lebih baik
Lihat dan unduh insight cepat untuk semua produk dan layanan terkait kemitraan yang disampaikan di IBM® Cloud

Pertanyaan umum

Akselerator AI Intel® Gaudi® 3 di IBM Cloud dirancang untuk beban kerja AI berkinerja tinggi, dengan fitur 64 Tensor Processor Cores (TPC) dan delapan Matrix Multiplication Engines (MME) untuk membantu mempercepat komputasi neural networks yang mendalam. Akselerator AI Intel® Gaudi® 3 di IBM Cloud juga dilengkapi dengan memori HBM2E 128 GB dan menawarkan bandwidth memori hingga 3,7 TB/detik, serta mendukung jaringan Ethernet standar industri dengan port 24x200 GbE, yang menyediakan bandwidth dua arah sebesar 9,6 Tbps untuk interkonektivitas sistem yang dapat diskalakan.

Akselerator AI Intel® Gaudi® 3 memberikan dukungan aplikasi AI yang luas, termasuk inferensi, pembuatan 3D, pembuatan teks, klasifikasi, pembuatan video, sentimen, penerjemahan, pembuatan gambar, peringkasan, dan Q&A – dengan fokus pada modal bahasa besar (LLM) multi-modal dan Generasi dengan dukungan pengambilan data (RAG).

Dengan memori HBM2E 128 GB dan bandwidth memori hingga 3,7 TB/detik, akselerator AI Intel® Gaudi® 3 pada IBM Cloud membantu memastikan throughput data cepat, mengurangi kemacetan, dan memungkinkan pengembang memproses kumpulan data besar dengan lebih cepat dan efisien.

Akselerator AI Intel® Gaudi® 3 di IBM Cloud dipasang dalam IBM Cloud Virtual Servers di IBM Cloud Virtual Private Cloud (VPC). IBM Cloud VPC adalah jaringan yang ditentukan perangkat lunak (SDN) yang sangat tangguh dan sangat aman yang dapat Anda gunakan untuk membangun cloud pribadi yang terisolasi, namun tetap mempertahankan manfaat cloud publik yang penting. Profil virtual server Intel® Gaudi® 3 di IBM Cloud VPC merupakan kombinasi prakonfigurasi dari vCPU, RAM, dan penyimpanan untuk memulai instans virtual servers dengan cepat.

Akselerator AI Intel® Gaudi® 3 di IBM Cloud mendukung kerangka kerja populer, termasuk PyTorch, ONNX, dan DeepSpeed. Lebih dari 400 ribu model tersedia di Hugging Face, dioptimalkan untuk digunakan dengan pustaka perangkat lunak Optimum Habana. Dukungan lengkap dari Intel® Gaudi® pada rangkaian perangkat lunak dan kerangka kerja dirancang untuk memfasilitasi migrasi yang mudah, sehingga pengembang dapat mengintegrasikan model yang ada dengan perubahan kode minimal.

 

Ambil langkah selanjutnya

Jelajahi Akselerator AI Intel® Gaudi® 3 di IBM Cloud.

  1. Konfigurasi, harga, dan penawaran
  2. Jelajahi dokumentasi