Granite

Model AI terbuka, berperforma tinggi, dan tepercaya yang dirancang untuk bisnis.

Ilustrasi bentuk geometris berlapis dalam gradien warna
IBM Granite 4.0: model Granite generasi berikutnya
Kurangi biaya dan percepat beban kerja dengan model efisien yang dirancang untuk adopsi AI yang dapat diskalakan dan siap untuk perusahaan.
Pelajari lebih lanjut

Sambutlah Granite

Bangun dan skalakan AI lebih cepat dengan model sumber terbuka yang dapat disesuaikan yang dioptimalkan untuk beban kerja perusahaan, efisiensi biaya, dan penerapan fleksibel.

Buka
Sumber terbuka di bawah Apache 2.0, Granite memastikan transparansi, sekaligus memungkinkan penyesuaian penuh dan fleksibilitas penerapan di semua infrastruktur.
Berkinerja baik
Model-model kecil berkinerja tinggi ini dirancang untuk memaksimalkan efisiensi dan skalabilitas untuk tugas-tugas perusahaan yang penting
Tepercaya
Hilangkan risiko AI “kotak hitam” dengan transparansi ke dalam data dan proses pelatihan, kemampuan deteksi kerusakan, dan pagar pembatas bawaan.

Memperkenalkan Granite 4.0

Kenali modelnya

Granite 4.0 Nano
Tugas AI yang ringan, lokal, dan mutakhir di mana komputasi dan konektivitas terbatas
Granite 4.0 Micro & Tiny
Tugas bervolume tinggi dan kompleksitas rendah di mana kecepatan, biaya, dan efisiensi adalah prioritas utama
Granite 4.0 Small
Alur kerja perusahaan yang membutuhkan kinerja yang lebih kuat tanpa biaya model perbatasan

Dalam angka

70%+
pengurangan kebutuhan memori
2X
kecepatan inferensi yang lebih cepat
Granite-Docling: Model super ringkas untuk konversi dokumen
IBM Granite-Docling adalah model sumber terbuka dan sangat efisien yang mengubah dokumen menjadi format yang dapat dibaca mesin sambil mempertahankan tata letak sepenuhnya.
Pelajari lebih lanjut

Kelompok model kecil Granite

Model Bahasa Kecil (SLM)

Model bahasa inti dengan penalaran, dioptimalkan untuk RAG dan alur kerja agen.

Embedding

Model yang menghasilkan penyematan teks berkualitas tinggi untuk pencarian semantik, RAG, dan pencarian informasi berulang kontekstual.

Konversi dokumen

Model visi bahasa super ringkas mengubah dokumen menjadi format terstruktur yang dapat dibaca mesin dengan tetap mempertahankan tata letak, tabel, dan persamaan.

Visi

Model visi bahasa yang efisien untuk pemahaman dokumen dan gambar, memungkinkan OCR, analisis bagan, dan ekstraksi konten perusahaan.

Ucapan

Model ujaran bahasa ringan untuk transkripsi dan terjemahan dalam 7 bahasa, memberikan akurasi dan efisiensi yang kuat.

Deret waktu

Model ringan yang telah dilatih sebelumnya untuk prediksi deret waktu yang cepat dan akurat, dioptimalkan untuk penerapan yang efisien di seluruh lingkungan perangkat keras.

Pembatas

Model pengaman mendeteksi halusinasi, bias, konten berbahaya, dan jailbreak, memastikan penerapan AI perusahaan yang aman di seluruh alur kerja.

Geospasial

Model NASA-IBM untuk pengamatan Bumi, memprediksi biomassa, iklim, suhu tanah, dan banjir dari data satelit skala besar.

Kinerja dan efisiensi

Granite 4.0 direkayasa untuk efisiensi, menggunakan lebih sedikit memori sekaligus memberikan laju yang lebih cepat dan kinerja tinggi. Keseimbangan ini memungkinkan perusahaan untuk mengurangi biaya dan menskalakan solusi lebih cepat di seluruh beban kerja penting.

Diagram lingkaran persyaratan RAM Granite 4.0

Model Granite 4.0 dirancang untuk melakukan lebih banyak dengan sumber daya lebih sedikit. Mereka menggunakan memori yang jauh lebih sedikit - lebih dari 70% lebih sedikit daripada model serupa - sehingga organisasi dapat menjalankan AI yang kuat di perangkat keras yang lebih terjangkau. Hal itu berarti biaya infrastruktur yang lebih rendah, kinerja yang lebih cepat, dan kemampuan untuk menskalakan AI dengan lebih mudah di seluruh bisnis.

Grafik garis throughput Granite 4.0

Granite 4.0 memberikan throughput tinggi secara konsisten seiring dengan peningkatan beban kerja, menangani ukuran batch yang lebih besar dengan mudah sementara model lain melambat. Hal ini memastikan perusahaan dapat mempertahankan kinerja yang andal untuk aplikasi yang perlu melayani banyak pengguna atau tugas kompleks sekaligus.

Grafik diagram pencar Kinerja Umum Granite 4.0

Granite 4.0 memberikan akurasi yang lebih tinggi dengan persyaratan memori yang jauh lebih rendah dibandingkan model pesaing, bahkan pada ukuran yang lebih kecil. Efisiensi itu diterjemahkan ke dalam penghematan biaya, aksesibilitas yang lebih besar, dan kemampuan untuk menerapkan AI perusahaan secara lebih luas dan fleksibel.

Skor RAG Granite 4.0
Granite 4.0 mengungguli model terbuka berukuran sama dan lebih besar pada tugas RAG. Dengan memberikan akurasi yang lebih tinggi tanpa menuntut infrastruktur tambahan, Granite membantu perusahaan membangun aplikasi yang lebih andal dan berbasis pengetahuan sambil menjaga penerapan tetap efisien dan hemat biaya.
Diagram batang papan peringkat IFEval Granite 4.0

Granite 4.0 menunjukkan kinerja mengikuti instruksi yang terdepan di industri di antara model terbuka, yang merupakan kemampuan penting untuk alur kerja agen. Dengan menyeimbangkan akurasi yang kuat dengan ukuran yang lebih kecil, Granite memberikan perusahaan output berkualitas tinggi untuk tugas-tugas kompleks dengan biaya infrastruktur yang lebih rendah daripada model terbuka yang lebih besar.

Diagram lingkaran persyaratan RAM Granite 4.0

Model Granite 4.0 dirancang untuk melakukan lebih banyak dengan sumber daya lebih sedikit. Mereka menggunakan memori yang jauh lebih sedikit - lebih dari 70% lebih sedikit daripada model serupa - sehingga organisasi dapat menjalankan AI yang kuat di perangkat keras yang lebih terjangkau. Hal itu berarti biaya infrastruktur yang lebih rendah, kinerja yang lebih cepat, dan kemampuan untuk menskalakan AI dengan lebih mudah di seluruh bisnis.

Grafik garis throughput Granite 4.0

Granite 4.0 memberikan throughput tinggi secara konsisten seiring dengan peningkatan beban kerja, menangani ukuran batch yang lebih besar dengan mudah sementara model lain melambat. Hal ini memastikan perusahaan dapat mempertahankan kinerja yang andal untuk aplikasi yang perlu melayani banyak pengguna atau tugas kompleks sekaligus.

Grafik diagram pencar Kinerja Umum Granite 4.0

Granite 4.0 memberikan akurasi yang lebih tinggi dengan persyaratan memori yang jauh lebih rendah dibandingkan model pesaing, bahkan pada ukuran yang lebih kecil. Efisiensi itu diterjemahkan ke dalam penghematan biaya, aksesibilitas yang lebih besar, dan kemampuan untuk menerapkan AI perusahaan secara lebih luas dan fleksibel.

Skor RAG Granite 4.0
Granite 4.0 mengungguli model terbuka berukuran sama dan lebih besar pada tugas RAG. Dengan memberikan akurasi yang lebih tinggi tanpa menuntut infrastruktur tambahan, Granite membantu perusahaan membangun aplikasi yang lebih andal dan berbasis pengetahuan sambil menjaga penerapan tetap efisien dan hemat biaya.
Diagram batang papan peringkat IFEval Granite 4.0

Granite 4.0 menunjukkan kinerja mengikuti instruksi yang terdepan di industri di antara model terbuka, yang merupakan kemampuan penting untuk alur kerja agen. Dengan menyeimbangkan akurasi yang kuat dengan ukuran yang lebih kecil, Granite memberikan perusahaan output berkualitas tinggi untuk tugas-tugas kompleks dengan biaya infrastruktur yang lebih rendah daripada model terbuka yang lebih besar.

Granite untuk pengembang

Resep: Ringkasan dokumen

Buat ringkasan dokumen dengan IBM Granite untuk memproses dokumen lebih dari batas jendela konteks.

RAG dengan Langchain

Bangun pipeline RAG dengan Granite untuk menjawab pertanyaan menggunakan basis pengetahuan eksternal.

Resep: RAG multimodal

Bangun pipeline RAG multimodal dengan Granite dan Docling untuk menanyakan teks, tabel, dan gambar.

Panduan: Model Sumber Terbuka

Lihat bagaimana LLM sumber terbuka memungkinkan otonomi, memangkas biaya, dan membantu pengembang dalam evaluasi, penyetelan, dan penerapan.

Tutorial: Perkiraan deret waktu

Gunakan model deret waktu Granite untuk melakukan prediksi deret waktu zero-shot dan fine-tuned.

Tutorial: Terjemahan ucapan

Gunakan pengenalan ucapan otomatis (ASR) untuk menghasilkan transkripsi podcast menggunakan Granite dan watsonx.ai.

Tutorial: Co-pilot AI Lokal

Bangun co-pilot AI lokal menggunakan IBM Granite Code, Ollama, dan Continue.

Lihat buku panduan granite lengkap

Lihat buku panduan granite lengkap

Buat dengan Granite

Model Granite mendorong AI di balik banyak produk dan layanan IBM. Temukan solusi siap pakai untuk pembuatan kode, pengembangan aplikasi, dan pengujian model. Semua didukung oleh IBM Granite.

Ikuti terus berita tentang AI

Blog | Granite 3.2: Penalaran baru dan kemampuan multimodal

Model Granite terbaru menghadirkan kemampuan penalaran baru, model yang didukung visi, dan peningkatan efisiensi—memberikan hasil yang kompetitif dengan biaya lebih rendah

Podcast | Fakta vs rumor DeepSeek, distilasi model, dan kompetisi sumber terbuka

Dalam Mixture of Experts - episode 40, panel menangani kesalahpahaman DeepSeek R1, menjelaskan distilasi model, dan membedah lingkungan kompetisi sumber terbuka.

Buletin AI Think | Dapatkan insight AI

Dapatkan pilihan topik, tren, dan riset AI yang dikurasi dan dikirim langsung ke kotak masuk Anda.

Artikel | AI DeepSeek membuktikan keunggulan model berukuran kecil

DeepSeek-R1 adalah asisten digital yang berkinerja sebaik o1 OpenAI pada tolok ukur AI tertentu dalam tugas matematika dan pengodean pada tolok ukur AI tertentu. Menurut perusahaan, model ini dilatih dengan jauh lebih sedikit chip dan biaya operasionalnya sekitar 96% lebih murah.

IBM percaya dalam penciptaan, penerapan, dan pemanfaatan model AI yang memajukan inovasi di seluruh perusahaan secara bertanggung jawab. watsonx AI dan platform data IBM memiliki proses menyeluruh dalam membangun serta menguji model dasar dan AI generatif. Untuk model yang dikembangkan IBM, kami mencari dan menghapus duplikasi. Selain itu, kami menggunakan daftar blokir URL, filter untuk konten yang tidak pantas dan kualitas dokumen, pemisahan kalimat, dan teknik tokenisasi, semuanya sebelum pelatihan model.

Selama proses pelatihan data, kami berupaya mencegah ketidakselarasan output model dan menggunakan penyesuaian yang diawasi agar dapat mengikuti instruksi yang lebih baik, sehingga model dapat digunakan untuk menyelesaikan tugas perusahaan melalui rekayasa prompt. Kami terus mengembangkan model Granite dalam beberapa arah, termasuk modalitas lain, konten spesifik industri, dan anotasi data tambahan untuk pelatihan. Di saat yang sama, menerapkan pertahanan perlindungan data secara berkala dan berkelanjutan untuk model yang dikembangkan IBM.  

Mengingat pesatnya perubahan lingkungan teknologi AI generatif, proses ujung-ke-ujung kami diperkirakan akan terus berkembang dan lebih baik. Sebagai bukti ketelitian yang dilakukan IBM dalam pengembangan dan pengujian model dasarnya, perusahaan memberikan ganti rugi hak kekayaan intelektual kontraktual standar untuk model yang dikembangkan IBM, serupa dengan yang disediakan untuk produk perangkat keras dan produk piranti lunak IBM.

Selain itu, berbeda dengan beberapa penyedia model bahasa besar lainnya dan selaras dengan pendekatan standar IBM mengenai ganti rugi, IBM tidak mewajibkan pelanggannya untuk mengganti rugi IBM atas penggunaan (oleh pelanggan) model yang dikembangkan oleh IBM. Serta selaras dengan pendekatan IBM terhadap kewajiban ganti ruginya, IBM tidak membatasi tanggung jawab ganti ruginya untuk model yang dikembangkan oleh IBM.

Model watsonx saat ini yang berada di bawah perlindungan ini meliputi:

(1) Model khusus enkoder dari lini Slate.

(2) Model khusus dekoder dari lini Granite.

Pelajari selengkapnya tentang pemberian lisensi untuk model Granite

* Bagaimana model AI yang lebih kecil dan disesuaikan dengan industri dapat memberikan manfaat yang lebih besar 
https://www.ft.com/partnercontent/ibm/how-smaller-industry-tailored-ai-models-can-offer-greater-benefits.html

1Kinerja model Granite yang dilakukan oleh IBM Research terhadap model-model terbuka terkemuka di seluruh tolok ukur akademis dan perusahaan - https://ibm.com/new/ibm-granite-3-0-open-state-of-the-art-enterprise-models