Intel® Gaudi® 3 AI Accelerators di IBM Cloud

Akselerator AI yang kuat, hemat biaya, dan terbuka untuk beban kerja AI generatif.

Tampilan dari dekat Gaudi 3 yang menawarkan 64 Tensor processor core (TPC) dan delapan matrix multiplication engine (MME)
IBM Cloud adalah penyedia layanan cloud global pertama yang menghadirkan Intel® Gaudi® 3

Buka, berinovasi, dan terapkan solusi AI baru dengan akselerator AI Intel® Gaudi® 3 di IBM Cloud®—dirancang untuk membantu Anda meningkatkan skala yang menghemat biaya untuk kebutuhan AI perusahaan dengan kinerja tinggi, fleksibilitas dalam penerapan, dan pengembangan terbuka.   

Mendukung berbagai aplikasi dan kerangka kerja inferensi AI generatif, termasuk model bahasa besar (LLM) dan model multi-modal (MMM). Mulai dengan cepat melalui penerapan IBM Cloud Virtual Servers for VPC. Dukungan untuk IBM watsonx®, Red Hat® OpenShift® Kubernetes Service, dan penerapan berbasis Terraform secara otomatis direncanakan untuk 1H 2025. Dukungan untuk klaster Red Hat OpenShift AI, IBM Cloud Kubernetes Service, dan arsitektur yang dapat diterapkan di IBM Cloud direncanakan untuk 2H 2025.

Pelajari selengkapnya tentang teknologi Intel Gaudi 3

Solusi baru untuk AI perusahaan
Grafik dan bagan ditampilkan pada ilustrasi latar belakang yang bersih
Harga dan kinerja AI yang kompetitif

Dapatkan kinerja AI generatif yang hemat biaya untuk throughput inferensi yang tinggi dan biaya kepemilikan total yang dioptimalkan.

 

Ikon awan yang mewakili dokumen, memproses ilustrasi terintegrasi
Penskalaan yang cepat dan efisien

Tingkatkan skalabilitas sistem dengan mudah melalui dukungan kapasitas yang fleksibel dan kebebasan dari penguncian sistem tertutup.

Ilustrasi aplikasi menampilkan berbagai warna di berbagai bagian dan fitur
Pengembangan terbuka, pilihan dalam penerapan

Percepat beban kerja AI dengan model penerapan Intel Gaudi 3 pilihan Anda dan bantu menghilangkan hambatan pengembang dengan model sumber terbuka pada cloud publik standar terbuka.

Terapkan berdasarkan kebutuhan infrastruktur dan perangkat lunak Anda

Intel® Gaudi® 3 AI accelerators dipasangkan dengan prosesor Intel Xeon Generasi ke-5 pada IBM Cloud Virtual Server for VPC.

Tampilan dari dekat Gaudi 3 yang menawarkan 64 Tensor processor core (TPC) dan delapan matrix multiplication engine (MME)
Menyediakan server mandiri di IBM Cloud Virtual Private Cloud (VPC)

Intel Gaudi 3 AI accelerators dapat diterapkan melalui IBM Cloud Virtual Server for VPC untuk instans cloud VPC. IBM Cloud VPC dirancang untuk ketahanan dan keamanan tinggi di dalam jaringan yang ditentukan perangkat lunak di mana klien dapat membangun cloud pribadi terisolasi sambil mempertahankan manfaat cloud publik yang penting. Instans cloud Intel Gaudi 3, yang juga mendukung gambar AI Red Hat Enterprise Linux, sangat ideal untuk klien dengan tumpukan perangkat lunak yang sangat khusus, atau mereka yang memerlukan kontrol penuh atas server yang mendasarinya.

Jelajahi penerapan server
Perbedaannya terletak pada desain
Memori bandwidth tinggi (HBM)

Percepat kinerja AI generatif dan bangun dengan lebih banyak token dan lebih banyak model pada satu kartu dengan kapasitas HBM 128 GB pada kecepatan bandwidth 3,7 TB/detik.

Ethernet standar industri

Hilangkan penguncian struktur dan bantu mengurangi biaya integrasi sekaligus meningkatkan pilihan Anda untuk beralih ke Ethernet standar industri.

 

Transmisi data berkapasitas tinggi

Dapatkan kapasitas skala besar dan peningkatan skala dengan port 24x 200 GbE RoCE berkapasitas tinggi.

Pengembangan terbuka

Sederhanakan pengembangan dengan Intel® Gaudi® 3 Extension untuk PyTorch dan bantu mengurangi waktu pengembangan dan pemeliharaan kode dengan pustaka model yang dioptimalkan pada Hugging Face.

Kinerja inti tinggi

Manfaatkan Akselerator AI Intel® Gaudi® 3 Matrix Multiplication Engine dengan core berkinerja tinggi khusus yang dirancang untuk transfer data yang lebih sedikit.

Migrasi yang disederhanakan

Model angkat dan geser dengan hanya tiga baris kode pada perangkat lunak terbuka dengan developer tools yang mudah digunakan.

Pertanyaan umum

Akselerator AI Intel® Gaudi® 3 di IBM Cloud dirancang untuk beban kerja AI berkinerja tinggi, dengan fitur 64 Tensor Processor Cores (TPC) dan delapan Matrix Multiplication Engines (MME) untuk membantu mempercepat komputasi neural networks yang mendalam. Akselerator AI Intel® Gaudi® 3 di IBM Cloud juga dilengkapi dengan memori HBM2E 128 GB dan menawarkan bandwidth memori hingga 3,7 TB/detik, serta mendukung jaringan Ethernet standar industri dengan port 24x200 GbE, yang menyediakan bandwidth dua arah sebesar 9,6 Tbps untuk interkonektivitas sistem yang dapat diskalakan.

Akselerator AI Intel® Gaudi® 3 memberikan dukungan aplikasi AI yang luas, termasuk inferensi, pembuatan 3D, pembuatan teks, klasifikasi, pembuatan video, sentimen, penerjemahan, pembuatan gambar, peringkasan, dan Q&A – dengan fokus pada modal bahasa besar (LLM) multi-modal dan Generasi dengan dukungan pengambilan data (RAG).

Dengan memori HBM2E 128 GB dan bandwidth memori hingga 3,7 TB/detik, akselerator AI Intel® Gaudi® 3 pada IBM Cloud membantu memastikan throughput data cepat, mengurangi kemacetan, dan memungkinkan pengembang memproses kumpulan data besar dengan lebih cepat dan efisien.

Akselerator AI Intel® Gaudi® 3 di IBM Cloud dipasang dalam IBM Cloud Virtual Servers di IBM Cloud Virtual Private Cloud (VPC). IBM Cloud VPC adalah jaringan yang ditentukan perangkat lunak (SDN) yang sangat tangguh dan sangat aman yang dapat Anda gunakan untuk membangun cloud pribadi yang terisolasi, namun tetap mempertahankan manfaat cloud publik yang penting. Profil virtual server Intel® Gaudi® 3 di IBM Cloud VPC merupakan kombinasi prakonfigurasi dari vCPU, RAM, dan penyimpanan untuk memulai instans virtual servers dengan cepat.

Akselerator AI Intel® Gaudi® 3 di IBM Cloud mendukung kerangka kerja populer, termasuk PyTorch, ONNX, dan DeepSpeed. Lebih dari 400 ribu model tersedia di Hugging Face, dioptimalkan untuk digunakan dengan pustaka perangkat lunak Optimum Habana. Dukungan lengkap dari Intel® Gaudi® pada rangkaian perangkat lunak dan kerangka kerja dirancang untuk memfasilitasi migrasi yang mudah, sehingga pengembang dapat mengintegrasikan model yang ada dengan perubahan kode minimal.

 

Ambil langkah selanjutnya

Jelajahi Akselerator AI Intel® Gaudi® 3 di IBM Cloud.

Konfigurasi, harga, dan penawaran Jelajahi dokumentasi