Akselerator AI yang kuat, hemat biaya, dan terbuka untuk beban kerja AI generatif.
Buka, berinovasi, dan terapkan solusi AI baru dengan akselerator AI Intel® Gaudi® 3 di IBM Cloud®—dirancang untuk membantu Anda meningkatkan skala yang menghemat biaya untuk kebutuhan AI perusahaan dengan kinerja tinggi, fleksibilitas dalam penerapan, dan pengembangan terbuka.
Mendukung berbagai aplikasi dan kerangka kerja inferensi AI generatif, termasuk model bahasa besar (LLM) dan model multi-modal (MMM). Mulai dengan cepat melalui penerapan IBM Cloud Virtual Servers for VPC. Dukungan untuk IBM watsonx®, Red Hat® OpenShift® Kubernetes Service, dan penerapan berbasis Terraform secara otomatis direncanakan untuk 1H 2025. Dukungan untuk klaster Red Hat OpenShift AI, IBM Cloud Kubernetes Service, dan arsitektur yang dapat diterapkan di IBM Cloud direncanakan untuk 2H 2025.
Pelajari selengkapnya tentang teknologi Intel Gaudi 3
Intel® Gaudi® 3 AI accelerators dipasangkan dengan prosesor Intel Xeon Generasi ke-5 pada IBM Cloud Virtual Server for VPC.
Intel Gaudi 3 AI accelerators dapat diterapkan melalui IBM Cloud Virtual Server for VPC untuk instans cloud VPC. IBM Cloud VPC dirancang untuk ketahanan dan keamanan tinggi di dalam jaringan yang ditentukan perangkat lunak di mana klien dapat membangun cloud pribadi terisolasi sambil mempertahankan manfaat cloud publik yang penting. Instans cloud Intel Gaudi 3, yang juga mendukung gambar AI Red Hat Enterprise Linux, sangat ideal untuk klien dengan tumpukan perangkat lunak yang sangat khusus, atau mereka yang memerlukan kontrol penuh atas server yang mendasarinya.
Akselerator AI Intel® Gaudi® 3 di IBM Cloud dirancang untuk beban kerja AI berkinerja tinggi, dengan fitur 64 Tensor Processor Cores (TPC) dan delapan Matrix Multiplication Engines (MME) untuk membantu mempercepat komputasi neural networks yang mendalam. Akselerator AI Intel® Gaudi® 3 di IBM Cloud juga dilengkapi dengan memori HBM2E 128 GB dan menawarkan bandwidth memori hingga 3,7 TB/detik, serta mendukung jaringan Ethernet standar industri dengan port 24x200 GbE, yang menyediakan bandwidth dua arah sebesar 9,6 Tbps untuk interkonektivitas sistem yang dapat diskalakan.
Akselerator AI Intel® Gaudi® 3 memberikan dukungan aplikasi AI yang luas, termasuk inferensi, pembuatan 3D, pembuatan teks, klasifikasi, pembuatan video, sentimen, penerjemahan, pembuatan gambar, peringkasan, dan Q&A – dengan fokus pada modal bahasa besar (LLM) multi-modal dan Generasi dengan dukungan pengambilan data (RAG).
Dengan memori HBM2E 128 GB dan bandwidth memori hingga 3,7 TB/detik, akselerator AI Intel® Gaudi® 3 pada IBM Cloud membantu memastikan throughput data cepat, mengurangi kemacetan, dan memungkinkan pengembang memproses kumpulan data besar dengan lebih cepat dan efisien.
Akselerator AI Intel® Gaudi® 3 di IBM Cloud dipasang dalam IBM Cloud Virtual Servers di IBM Cloud Virtual Private Cloud (VPC). IBM Cloud VPC adalah jaringan yang ditentukan perangkat lunak (SDN) yang sangat tangguh dan sangat aman yang dapat Anda gunakan untuk membangun cloud pribadi yang terisolasi, namun tetap mempertahankan manfaat cloud publik yang penting. Profil virtual server Intel® Gaudi® 3 di IBM Cloud VPC merupakan kombinasi prakonfigurasi dari vCPU, RAM, dan penyimpanan untuk memulai instans virtual servers dengan cepat.
Akselerator AI Intel® Gaudi® 3
di IBM Cloud mendukung kerangka kerja populer, termasuk
PyTorch, ONNX, dan DeepSpeed. Lebih dari 400 ribu model tersedia di Hugging Face, dioptimalkan untuk digunakan dengan
pustaka perangkat lunak Optimum Habana. Dukungan lengkap dari Intel® Gaudi®
pada rangkaian perangkat lunak dan kerangka kerja dirancang untuk memfasilitasi migrasi yang mudah,
sehingga pengembang dapat mengintegrasikan model yang ada dengan perubahan kode minimal.