Granite

Terbuka. Berkinerja tinggi. Tepercaya. Apache 2.0 berlisensi. Ditandatangani secara kriptografis1. Bersertifikasi ISO2.

Ilustrasi bentuk geometris berlapis dalam gradien warna
IBM Granite 4.1 mendukung penerapan AI yang aman di lingkungan lokal
Model yang ringan dan berkinerja tinggi, dirilis di bawah lisensi Apache 2.0, dirancang untuk beban kerja perusahaan yang dapat diskalakan
Pelajari Granite 4.1

Mengapa harus membangun solusi dengan Granite?

Bangun dan tingkatkan skala AI lebih cepat dengan model sumber terbuka yang dapat disesuaikan dan dioptimalkan untuk beban kerja perusahaan, efisiensi biaya, dan penerapan yang fleksibel.

Buka
Sumber terbuka di bawah Apache 2.0, Granite memastikan transparansi, sekaligus memungkinkan penyesuaian penuh dan fleksibilitas penerapan di semua infrastruktur.
Unduh model
Berkinerja baik
Model-model kecil berkinerja tinggi ini dirancang untuk memaksimalkan efisiensi dan skalabilitas untuk tugas-tugas perusahaan yang penting
Tinjau tolok ukur
Tepercaya
Hilangkan risiko AI “kotak hitam” dengan transparansi ke dalam data dan proses pelatihan, kemampuan deteksi kerusakan, dan pagar pembatas bawaan.
Pelajari lebih lanjut
Memperkenalkan Granite 4.1
Model bahasa Granite 4.1

Model non-penalaran padat kami dengan kinerja tertinggi saat ini. Mampu bersaing dengan model yang lebih besar dan cerdas di berbagai tugas perusahaan, dengan biaya yang jauh lebih rendah. 

Unduh model bahasa
Model ucapan Granite 4.1

Kecil, tetapi tangguh. Akurasi transkripsi terkemuka di industri untuk berbagai aksen, domain, dan lingkungan yang bising. 

Unduh model ucapan
Model visi Granite 4.1

Pahami dokumen, bagan, dan gambar dengan presisi tingkat perusahaan.

Unduh model visi
Model pengawas Granite 4.1

Pengamanan untuk deteksi konten dan output berbahaya. Dirancang untuk kepatuhan perusahaan.

Unduh model pengawas
Model penyematan Granite

Representasi semantik yang akurat untuk pengambilan, pencarian, dan klasifikasi data.

Unduh model penyematan

Jelajahi tolok ukur

Model-model ini telah dievaluasi berdasarkan sekumpulan besar metrik dan kumpulan data untuk mencakup berbagai aspek pembuatan teks. Lihat tolok ukur tambahan di blog teknis Granite.​

 

Tolok ukur​Metricgranite-4.1-3b​granite-4.1-8b​granite-4.1-30b​
MMLU​5-shot​67,02​73,84​80,16​
Rata-rata IFEval​ 82,3​87,06​89,65​
ArenaHard​ 37,8​68,98​71,02​
GSM8K​8-shot​86,88​92,49​94,16​
HumanEval​pass@1​79,27​87,2​89,63​
BFCL v3​ 60,8​68,27​73,68​
MMMLU​5-shot​57,61​64,84​73,71​
AttaQ​ 81,88​81,19​85,76​

Akses dan build

Hugging Face

Buka Hugging Face
Ollama

Buka Ollama
LM Studio

Buka LM Studio
watsonx.ai

Buka watsonx
OpenRouter

Buka OpenRouter
Replicate

Buka Replicate
Weights & Biases

Buka Weights & Biases
Unsloth

Buka Unsloth
AnythingLLM

Buka AnythingLLM

Kinerja dan efisiensi

Granite 4.1 memberikan kinerja kompetitif sesuai instruksi dan panggilan alat tanpa membutuhkan rantai pemikiran yang panjang, menawarkan latensi yang dapat diprediksi, penggunaan token yang stabil, dan biaya operasional yang lebih rendah. Ini menjadikannya pilihan yang andal dan siap produksi untuk beban kerja perusahaan yang mengutamakan efisiensi dan keandalan.

Model bahasa Granite 4.1 memahami dan menjalankan instruksi berbasis alat, sehingga memungkinkan integrasi mulus dengan berbagai alat perangkat lunak dan API. Dengan kemampuan ini, perusahaan dapat membuat alur kerja berbasis AI yang baik sekaligus mengotomatiskan tugas-tugas kompleks.

Diagram batang horizontal berjudul “Granite 4.1 language models offer superior tool calling capabilities”, berdasarkan skor tolok ukur BFCL V3 (lebih tinggi lebih baik). Granite-4.1-30B menduduki peringkat tertinggi dengan skor 73,7, diikuti oleh Gemma-4-31B-it dengan skor 72,7, dan Granite-4.1-8B dengan skor 68,3. Model lainnya mendapatkan skor antara 61,7 dan 67,8, termasuk Gemma-4-26B-A4B-it (67,8), Qwen3-30B-A3B-Instruct-2507 (65,1), Granite-4.0-H-Small (64,7), Qwen3.5-35B-A3B (64,2), Gemma-4-E4B-it (63,2), Qwen3-4B-Instruct-2507 (61,9), dan Qwen3.5-9B (61,7). Model Granite 4.1 ditandai dengan warna biru dan mengungguli yang lain.

Model bahasa Granite 4.1 memahami dan mematuhi instruksi pengguna demi memastikan penyelesaian tugas yang andal dan akurat. Kemampuan ini sangat berharga bagi perusahaan yang ingin mengotomatiskan proses dan memberikan hasil yang konsisten dan berkualitas tinggi.

Diagram batang horizontal berjudul “Granite 4.1 language models offer competitive instruction following capabilities”, berdasarkan hasil IFEval. Gemma-4-31B-it menempati peringkat tertinggi dengan skor 94,1, diikuti Gemma-4-26B-A4B-it dengan skor 91,3. Granite-4.1-30B mendapatkan skor 89,7, yang sedikit lebih dibandingkan Qwen3.5-35B-A3B yang menerima skor 89,1 serta jauh di atas beberapa model dalam kelompok skor antara 85 dan 88, termasuk Gemma-4-E4B-it (87,8), Granite-4.0-H-Small (87,5), Qwen3.5-9B (87,2), dan Granite-4.1-8B (87,1). Model yang lebih lemah mencakup Granite-4.1-3B dengan skor 82,1 dan Qwen3.5-2B dengan skor 70,6. Model Granite 4.1 ditandai dengan warna biru, menunjukkan kinerja kompetitif tetapi bukan yang terbaik dibandingkan dengan model Gemma.

Granite Guardian 4.1 mendeteksi dimensi risiko utama yang tercantum dalam Atlas Risiko AI IBM. Dilatih menggunakan data unik yang terdiri dari anotasi manusia dan data sintetis dari simulasi red teaming internal, Guardian mengungguli model serupa pada tolok ukur standar (termasuk, tetapi tidak terbatas pada, upaya jailbreak, kata-kata tidak sopan dan halusinasi yang terkait dengan panggilan alat, serta pembuatan output dengan dukungan pengambilan data dalam sistem berbasis agen).

Tabel yang membandingkan kinerja model dari semua kumpulan data evaluasi, dengan kolom yang mencantumkan Granite-Guardian-4.1-8B, OffsetBias-8B, Skywork-Reward-8B, Skywork-Reward-27B, SFR-Judge-70B, dan Oracle sebagai dasar pengukuran. Granite-Guardian-4.1-8B (ditandai) mencapai hasil yang baik di semua kumpulan data: GSM8k (93,71), MATH (50,79), HumanEval+ (80,08), MBPP+ (70,63), BigCodeBench (43,70), dan IFEval (82,81), dengan skor keseluruhan 70,29. Ini sedikit mengungguli model lain di sebagian besar kategori, sementara skor Oracle tetap tertinggi secara keseluruhan, termasuk 97,46 pada GSM8k dan 81,54 secara keseluruhan.

Granite Speech 4.1 menghadirkan pengenalan ucapan yang sangat akurat dan siap digunakan perusahaan di berbagai lingkungan audio dunia nyata. Model ini mencapai tingkat kesalahan kata yang rendah pada tolok ukur yang mencakup ucapan dalam percakapan, rapat, presentasi, dan konferensi publik perusahaan untuk membahas kinerja keuangan (earnings call).

Kelompok diagram batang berjudul “Granite Speech 4.1 outperforms peers in transcription accuracy”, menampilkan tingkat kesalahan kata dalam pengenalan ucapan otomatis (automatic speech recognition, ASR) untuk bahasa Inggris pada sembilan kumpulan data (lebih rendah lebih baik): GigaSpeech, LScln, LSoth, SPGI, AMI_IHM, AMI_SDM, VoxPopuli, TED-LIUM, dan Earnings-22. Beberapa model dibandingkan, termasuk Whisper-large-v3, Gemini 2.0 Flash, phi-4-mm, Qwen ASR, Canary, dan varian Granite Speech (warna biru muda). Model Granite Speech secara konsisten termasuk sebagai model dengan tingkat kesalahan terendah di sebagian besar kumpulan data. Tingkat kesalahan berkisar dari sekitar 1—2 pada LScln, 3—5 pada LSoth dan SPGI, sekitar 9—16 pada AMI_IHM, dan yang tertinggi pada— AMI_SDM (sekitar 22—41). Diagram ini menandai Granite Speech 4.1 sebagai model yang memberikan akurasi transkripsi terbaik secara keseluruhan dibandingkan dengan model-model pesaing.

Granite Vision 4.1 memberikan kinerja terdepan di industri dalam mengekstraksi informasi terstruktur dari konten visual. Model ini mencapai skor rata-rata tertinggi dari tujuh tolok ukur yang mencakup ekstraksi diagram, ekstraksi tabel, dan ekstraksi pasangan kunci-nilai (key-value pair, KVP).

Diagram batang horizontal berjudul “Granite Vision 4.1 tops Claude Opus 4.6 in table extraction”, menampilkan skor rata-rata dari sembilan tolok ukur ekstraksi (lebih tinggi lebih baik). Granite-Vision-4.1-4B meraih peringkat tertinggi dengan skor 86,5, diikuti oleh Claude-Opus-4.6 dengan skor 83,8. Model lainnya mendapatkan skor lebih rendah: Gemma4-E4B (72,4), Qwen3.5-4B (71,7), Ministral-3-8B (68,2), dan InternVL3.5-4B (66,4). Granite Vision ditandai dengan warna biru, Claude ditandai dengan warna ungu, dan model lainnya berwarna abu-abu, menekankan Granite Vision sebagai model berkinerja terbaik.

Dipercaya perusahaan di semua industri

US Open

US Open ingin melibatkan penggemar di seluruh dunia dengan pengalaman digital yang terus berkembang. IBM membantu mengubah data pertandingan yang sangat besar menjadi wawasan berbasis AI dan fitur interaktif. Ini ditujukan untuk menghadirkan pengalaman situs web dan aplikasi dinamis yang membantu penggemar terkoneksi dan terlibat dalam setiap momen.

14 Juta
penggemar di seluruh dunia memasuki pengalaman digital kelas dunia
7 juta
poin data yang diterima dan dianalisis sepanjang turnamen
Pemandangan luas stadion US Open dengan banyak penggemar yang sedang menonton pertandingan

Granite untuk pengembang

Resep: Ringkasan dokumen

Buat ringkasan dokumen dengan IBM Granite untuk memproses dokumen lebih dari batas jendela konteks.

RAG dengan Langchain

Bangun pipeline RAG dengan Granite untuk menjawab pertanyaan menggunakan basis pengetahuan eksternal.

Resep: RAG multimodal

Bangun pipeline RAG multimodal dengan Granite dan Docling untuk menanyakan teks, tabel, dan gambar.

Panduan: Model Sumber Terbuka

Lihat bagaimana LLM sumber terbuka memungkinkan otonomi, memangkas biaya, dan membantu pengembang dalam evaluasi, penyetelan, dan penerapan.

Tutorial: Perkiraan deret waktu

Gunakan model deret waktu Granite untuk melakukan prediksi deret waktu zero-shot dan fine-tuned.

Granite Agent Cookbook

Panduan Granite untuk tugas-tugas keagenan.

Tutorial: Co-pilot AI Lokal

Bangun co-pilot AI lokal menggunakan IBM Granite Code, Ollama, dan Continue.

Granite Cookbook

Lihat Granite Cookbook lengkap

Buat dengan Granite

Model Granite mendorong AI di balik banyak produk dan layanan IBM. Temukan solusi siap pakai untuk pembuatan kode, pengembangan aplikasi, dan pengujian model. Semua didukung oleh IBM Granite.

Agen Pengodean AI

Percepat pengodean dan sederhanakan pengembangan dengan AI dan otomatisasi yang memanfaatkan model Granite.

Jelajahi AI Coding Agent
watsonx.ai

Buat dan terapkan aplikasi AI menggunakan model Granite atau pilih dari berbagai model pihak ketiga.

Jelajahi watsonx.ai
watsonx Orchestrate

Kembangkan dan kelola agen AI yang didukung oleh Granite dan jelajahi katalog agen yang dibuat sebelumnya.

Jelajahi watsonx Orchestrate
Red Hat Enterprise Linux AI

Kembangkan, uji, dan jalankan LLM, termasuk Granite.

Jelajahi Red Hat Enterprise Linux AI

IBM percaya dalam penciptaan, penerapan, dan pemanfaatan model AI yang memajukan inovasi di seluruh perusahaan secara bertanggung jawab. watsonx AI dan platform data IBM memiliki proses menyeluruh dalam membangun serta menguji model dasar dan AI generatif. Untuk model yang dikembangkan IBM, kami mencari dan menghapus duplikasi. Selain itu, kami menggunakan daftar blokir URL, filter untuk konten yang tidak pantas dan kualitas dokumen, pemisahan kalimat, dan teknik tokenisasi, semuanya sebelum pelatihan model.

Selama proses pelatihan data, kami berupaya mencegah ketidakselarasan output model dan menggunakan penyesuaian yang diawasi agar dapat mengikuti instruksi yang lebih baik, sehingga model dapat digunakan untuk menyelesaikan tugas perusahaan melalui rekayasa prompt. Kami terus mengembangkan model Granite dalam beberapa arah, termasuk modalitas lain, konten spesifik industri, dan anotasi data tambahan untuk pelatihan. Di saat yang sama, menerapkan pertahanan perlindungan data secara berkala dan berkelanjutan untuk model yang dikembangkan IBM.  

Mengingat pesatnya perubahan lingkungan teknologi AI generatif, proses ujung-ke-ujung kami diperkirakan akan terus berkembang dan lebih baik. Sebagai bukti ketelitian yang dilakukan IBM dalam pengembangan dan pengujian model dasarnya, perusahaan memberikan ganti rugi hak kekayaan intelektual kontraktual standar untuk model yang dikembangkan IBM, serupa dengan yang disediakan untuk produk perangkat keras dan produk piranti lunak IBM.

Selain itu, berbeda dengan beberapa penyedia model bahasa besar lainnya dan selaras dengan pendekatan standar IBM mengenai ganti rugi, IBM tidak mewajibkan pelanggannya untuk mengganti rugi IBM atas penggunaan (oleh pelanggan) model yang dikembangkan oleh IBM. Serta selaras dengan pendekatan IBM terhadap kewajiban ganti ruginya, IBM tidak membatasi tanggung jawab ganti ruginya untuk model yang dikembangkan oleh IBM.

Model watsonx saat ini yang berada di bawah perlindungan ini meliputi:

(1) Model khusus enkoder dari lini Slate.

(2) Model khusus dekoder dari lini Granite.

Pelajari selengkapnya tentang pemberian lisensi untuk model Granite

1Pada 29 April 2026, model bahasa, visi, ucapan, penyematan, dan pengawas Granite yang dirilis sedang ditandatangani secara kriptografis.

2Sertifikasi ISO diberikan untuk Granite AI Management System (AIMS) dari model bahasa Granite. Sertifikat ini dapat ditemukan di sini: https://www.schellman.com/certificate-directory pada sertifikat No. 1102257-1.