Granite | IBM

Ilustrasi bentuk geometris berlapis dalam gradien warna

IBM Granite 4.1 mendukung penerapan AI yang aman di lingkungan lokal

Model yang ringan dan berkinerja tinggi, dirilis di bawah lisensi Apache 2.0, dirancang untuk beban kerja perusahaan yang dapat diskalakan

Pelajari Granite 4.1

Mengapa harus membangun solusi dengan Granite?

Bangun dan tingkatkan skala AI lebih cepat dengan model sumber terbuka yang dapat disesuaikan dan dioptimalkan untuk beban kerja perusahaan, efisiensi biaya, dan penerapan yang fleksibel.

Buka

Sumber terbuka di bawah Apache 2.0, Granite memastikan transparansi, sekaligus memungkinkan penyesuaian penuh dan fleksibilitas penerapan di semua infrastruktur.

Unduh model

Berkinerja baik

Model-model kecil berkinerja tinggi ini dirancang untuk memaksimalkan efisiensi dan skalabilitas untuk tugas-tugas perusahaan yang penting

Tinjau tolok ukur

Tepercaya

Hilangkan risiko AI “kotak hitam” dengan transparansi ke dalam data dan proses pelatihan, kemampuan deteksi kerusakan, dan pagar pembatas bawaan.

Pelajari lebih lanjut

Memperkenalkan Granite 4.1

Model bahasa Granite 4.1

Model non-penalaran padat kami dengan kinerja tertinggi saat ini. Mampu bersaing dengan model yang lebih besar dan cerdas di berbagai tugas perusahaan, dengan biaya yang jauh lebih rendah.

Unduh model bahasa

Model ucapan Granite 4.1

Kecil, tetapi tangguh. Akurasi transkripsi terkemuka di industri untuk berbagai aksen, domain, dan lingkungan yang bising.

Unduh model ucapan

Model visi Granite 4.1

Pahami dokumen, bagan, dan gambar dengan presisi tingkat perusahaan.

Unduh model visi

Model pengawas Granite 4.1

Pengamanan untuk deteksi konten dan output berbahaya. Dirancang untuk kepatuhan perusahaan.

Unduh model pengawas

Model penyematan Granite

Representasi semantik yang akurat untuk pengambilan, pencarian, dan klasifikasi data.

Unduh model penyematan

Jelajahi tolok ukur

Model-model ini telah dievaluasi berdasarkan sekumpulan besar metrik dan kumpulan data untuk mencakup berbagai aspek pembuatan teks. Lihat tolok ukur tambahan di blog teknis Granite.

Tolok ukur	Metric	granite-4.1-3b	granite-4.1-8b	granite-4.1-30b
MMLU	5-shot	67,02	73,84	80,16
Rata-rata IFEval		82,3	87,06	89,65
ArenaHard		37,8	68,98	71,02
GSM8K	8-shot	86,88	92,49	94,16
HumanEval	pass@1	79,27	87,2	89,63
BFCL v3		60,8	68,27	73,68
MMMLU	5-shot	57,61	64,84	73,71
AttaQ		81,88	81,19	85,76

Akses dan build

Hugging Face

Ollama

LM Studio

watsonx.ai

OpenRouter

Replicate

Weights & Biases

Buka Weights & Biases

Unsloth

Buka Unsloth

AnythingLLM

Buka AnythingLLM

Kinerja dan efisiensi

Granite 4.1 memberikan kinerja kompetitif sesuai instruksi dan panggilan alat tanpa membutuhkan rantai pemikiran yang panjang, menawarkan latensi yang dapat diprediksi, penggunaan token yang stabil, dan biaya operasional yang lebih rendah. Ini menjadikannya pilihan yang andal dan siap produksi untuk beban kerja perusahaan yang mengutamakan efisiensi dan keandalan.

Pemanggilan alat
Instruksi Mengikuti
Deteksi bahaya
Akurasi transkripsi
Ekstraksi tabel dan diagram

Model bahasa Granite 4.1 memahami dan menjalankan instruksi berbasis alat, sehingga memungkinkan integrasi mulus dengan berbagai alat perangkat lunak dan API. Dengan kemampuan ini, perusahaan dapat membuat alur kerja berbasis AI yang baik sekaligus mengotomatiskan tugas-tugas kompleks.

Diagram batang horizontal berjudul “Granite 4.1 language models offer superior tool calling capabilities”, berdasarkan skor tolok ukur BFCL V3 (lebih tinggi lebih baik). Granite-4.1-30B menduduki peringkat tertinggi dengan skor 73,7, diikuti oleh Gemma-4-31B-it dengan skor 72,7, dan Granite-4.1-8B dengan skor 68,3. Model lainnya mendapatkan skor antara 61,7 dan 67,8, termasuk Gemma-4-26B-A4B-it (67,8), Qwen3-30B-A3B-Instruct-2507 (65,1), Granite-4.0-H-Small (64,7), Qwen3.5-35B-A3B (64,2), Gemma-4-E4B-it (63,2), Qwen3-4B-Instruct-2507 (61,9), dan Qwen3.5-9B (61,7). Model Granite 4.1 ditandai dengan warna biru dan mengungguli yang lain.

Model bahasa Granite 4.1 memahami dan mematuhi instruksi pengguna demi memastikan penyelesaian tugas yang andal dan akurat. Kemampuan ini sangat berharga bagi perusahaan yang ingin mengotomatiskan proses dan memberikan hasil yang konsisten dan berkualitas tinggi.

Diagram batang horizontal berjudul “Granite 4.1 language models offer competitive instruction following capabilities”, berdasarkan hasil IFEval. Gemma-4-31B-it menempati peringkat tertinggi dengan skor 94,1, diikuti Gemma-4-26B-A4B-it dengan skor 91,3. Granite-4.1-30B mendapatkan skor 89,7, yang sedikit lebih dibandingkan Qwen3.5-35B-A3B yang menerima skor 89,1 serta jauh di atas beberapa model dalam kelompok skor antara 85 dan 88, termasuk Gemma-4-E4B-it (87,8), Granite-4.0-H-Small (87,5), Qwen3.5-9B (87,2), dan Granite-4.1-8B (87,1). Model yang lebih lemah mencakup Granite-4.1-3B dengan skor 82,1 dan Qwen3.5-2B dengan skor 70,6. Model Granite 4.1 ditandai dengan warna biru, menunjukkan kinerja kompetitif tetapi bukan yang terbaik dibandingkan dengan model Gemma.

Granite Guardian 4.1 mendeteksi dimensi risiko utama yang tercantum dalam Atlas Risiko AI IBM. Dilatih menggunakan data unik yang terdiri dari anotasi manusia dan data sintetis dari simulasi red teaming internal, Guardian mengungguli model serupa pada tolok ukur standar (termasuk, tetapi tidak terbatas pada, upaya jailbreak, kata-kata tidak sopan dan halusinasi yang terkait dengan panggilan alat, serta pembuatan output dengan dukungan pengambilan data dalam sistem berbasis agen).

Tabel yang membandingkan kinerja model dari semua kumpulan data evaluasi, dengan kolom yang mencantumkan Granite-Guardian-4.1-8B, OffsetBias-8B, Skywork-Reward-8B, Skywork-Reward-27B, SFR-Judge-70B, dan Oracle sebagai dasar pengukuran. Granite-Guardian-4.1-8B (ditandai) mencapai hasil yang baik di semua kumpulan data: GSM8k (93,71), MATH (50,79), HumanEval+ (80,08), MBPP+ (70,63), BigCodeBench (43,70), dan IFEval (82,81), dengan skor keseluruhan 70,29. Ini sedikit mengungguli model lain di sebagian besar kategori, sementara skor Oracle tetap tertinggi secara keseluruhan, termasuk 97,46 pada GSM8k dan 81,54 secara keseluruhan.

Granite Speech 4.1 menghadirkan pengenalan ucapan yang sangat akurat dan siap digunakan perusahaan di berbagai lingkungan audio dunia nyata. Model ini mencapai tingkat kesalahan kata yang rendah pada tolok ukur yang mencakup ucapan dalam percakapan, rapat, presentasi, dan konferensi publik perusahaan untuk membahas kinerja keuangan (earnings call).

Kelompok diagram batang berjudul “Granite Speech 4.1 outperforms peers in transcription accuracy”, menampilkan tingkat kesalahan kata dalam pengenalan ucapan otomatis (automatic speech recognition, ASR) untuk bahasa Inggris pada sembilan kumpulan data (lebih rendah lebih baik): GigaSpeech, LScln, LSoth, SPGI, AMI_IHM, AMI_SDM, VoxPopuli, TED-LIUM, dan Earnings-22. Beberapa model dibandingkan, termasuk Whisper-large-v3, Gemini 2.0 Flash, phi-4-mm, Qwen ASR, Canary, dan varian Granite Speech (warna biru muda). Model Granite Speech secara konsisten termasuk sebagai model dengan tingkat kesalahan terendah di sebagian besar kumpulan data. Tingkat kesalahan berkisar dari sekitar 1—2 pada LScln, 3—5 pada LSoth dan SPGI, sekitar 9—16 pada AMI_IHM, dan yang tertinggi pada— AMI_SDM (sekitar 22—41). Diagram ini menandai Granite Speech 4.1 sebagai model yang memberikan akurasi transkripsi terbaik secara keseluruhan dibandingkan dengan model-model pesaing.

Granite Vision 4.1 memberikan kinerja terdepan di industri dalam mengekstraksi informasi terstruktur dari konten visual. Model ini mencapai skor rata-rata tertinggi dari tujuh tolok ukur yang mencakup ekstraksi diagram, ekstraksi tabel, dan ekstraksi pasangan kunci-nilai (key-value pair, KVP).

Diagram batang horizontal berjudul “Granite Vision 4.1 tops Claude Opus 4.6 in table extraction”, menampilkan skor rata-rata dari sembilan tolok ukur ekstraksi (lebih tinggi lebih baik). Granite-Vision-4.1-4B meraih peringkat tertinggi dengan skor 86,5, diikuti oleh Claude-Opus-4.6 dengan skor 83,8. Model lainnya mendapatkan skor lebih rendah: Gemma4-E4B (72,4), Qwen3.5-4B (71,7), Ministral-3-8B (68,2), dan InternVL3.5-4B (66,4). Granite Vision ditandai dengan warna biru, Claude ditandai dengan warna ungu, dan model lainnya berwarna abu-abu, menekankan Granite Vision sebagai model berkinerja terbaik.

Dipercaya perusahaan di semua industri

US Open

US Open ingin melibatkan penggemar di seluruh dunia dengan pengalaman digital yang terus berkembang. IBM membantu mengubah data pertandingan yang sangat besar menjadi wawasan berbasis AI dan fitur interaktif. Ini ditujukan untuk menghadirkan pengalaman situs web dan aplikasi dinamis yang membantu penggemar terkoneksi dan terlibat dalam setiap momen.

14 Juta

penggemar di seluruh dunia memasuki pengalaman digital kelas dunia

7 juta

poin data yang diterima dan dianalisis sepanjang turnamen

Baca studi kasus

Scuderia Ferrari HP

Scuderia Ferrari ingin mengembangkan pengalaman digitalnya agar lebih melibatkan basis penggemar global. IBM membantu mengubah data balapan yang sangat besar menjadi insight berteknologi AI dan konten yang dipersonalisasi, demi menghadirkan aplikasi lebih baik yang mendekatkan penggemar kepada aksi melalui fitur interaktif dan penceritaan yang menarik.

Baca studi kasus

Blue Pearl

Blue Pearl ingin menjadikan proses perekrutannya lebih cepat dan efisien. IBM membantu mengubah alur kerja SDM dengan pencocokan pekerjaan yang didukung AI dan pembuatan konten otomatis untuk menghubungkan kandidat dan pemberi kerja dengan akurasi dan kecepatan yang lebih tinggi.

85%

pengurangan waktu rata-rata untuk mengisi lowongan

97%

pengurangan waktu penyaringan

Baca studi kasus

Food Ladder

Food Ladder perlu meningkatkan upayanya memerangi kerawanan pangan sekaligus mendukung komunitas terpencil. IBM membantu menghadirkan otomatisasi yang didukung AI dan alat digital untuk memperluas jangkauannya, dengan memberikan platform lebih cerdas yang memungkinkan produksi pangan berkelanjutan dan pengalaman belajar yang dipersonalisasi di seluruh dunia.

85.000

paket makanan disediakan dari satu gudang

25 Juta

paket makanan ditargetkan untuk tahun 2030, meningkat dari 132.480 paket makanan pada tahun 2024

Baca studi kasus

Granite untuk pengembang

Resep: Ringkasan dokumen

Buat ringkasan dokumen dengan IBM Granite untuk memproses dokumen lebih dari batas jendela konteks.

RAG dengan Langchain

Bangun pipeline RAG dengan Granite untuk menjawab pertanyaan menggunakan basis pengetahuan eksternal.

Resep: RAG multimodal

Bangun pipeline RAG multimodal dengan Granite dan Docling untuk menanyakan teks, tabel, dan gambar.

Panduan: Model Sumber Terbuka

Lihat bagaimana LLM sumber terbuka memungkinkan otonomi, memangkas biaya, dan membantu pengembang dalam evaluasi, penyetelan, dan penerapan.

Tutorial: Perkiraan deret waktu

Gunakan model deret waktu Granite untuk melakukan prediksi deret waktu zero-shot dan fine-tuned.

Granite Agent Cookbook

Panduan Granite untuk tugas-tugas keagenan.

Tutorial: Co-pilot AI Lokal

Bangun co-pilot AI lokal menggunakan IBM Granite Code, Ollama, dan Continue.

Granite Cookbook

Lihat Granite Cookbook lengkap

Buat dengan Granite

Model Granite mendorong AI di balik banyak produk dan layanan IBM. Temukan solusi siap pakai untuk pembuatan kode, pengembangan aplikasi, dan pengujian model. Semua didukung oleh IBM Granite.

Agen Pengodean AI

Percepat pengodean dan sederhanakan pengembangan dengan AI dan otomatisasi yang memanfaatkan model Granite.

Jelajahi AI Coding Agent

watsonx.ai

Buat dan terapkan aplikasi AI menggunakan model Granite atau pilih dari berbagai model pihak ketiga.

Jelajahi watsonx.ai

watsonx Orchestrate

Kembangkan dan kelola agen AI yang didukung oleh Granite dan jelajahi katalog agen yang dibuat sebelumnya.

Jelajahi watsonx Orchestrate

Red Hat Enterprise Linux AI

Kembangkan, uji, dan jalankan LLM, termasuk Granite.

Jelajahi Red Hat Enterprise Linux AI

Analis dan papan peringkat

IBM dinobatkan sebagai Pemimpin dalam Ilmu Data dan Machine Learning

Baca laporan untuk melihat bagaimana IBM memberdayakan ilmuwan data dan insinyur machine learning untuk membangun, menerapkan, dan mengatur aplikasi AI yang berdampak di seluruh perusahaan mereka.

Papan Peringkat GuardBench untuk Model Pembatas

Temukan alasan model-model Granite Guardian menempati enam posisi dari 10 posisi teratas di Papan Peringkat GuardBench, unggul dalam mengidentifikasi perintah dan respons buatan LLM yang berbahaya atau berniat jahat.

Papan Peringkat ASR Terbuka untuk Pengenalan Suara

Jelajahi papan peringkat di mana IBM menduduki peringkat teratas model pengenalan suara berdasarkan tingkat kesalahan kata yang rendah.

Stanford Transparency Index

Jelajahi mengapa Granite mendapatkan peringkat teratas dalam Stanford Foundation Model Transparency Index, yang menilai keterbukaan terkait sumber data, ukuran kumpulan data, penyaringan konten berbahaya, dan faktor transparansi utama lainnya.

Langkah selanjutnya

IBM percaya dalam penciptaan, penerapan, dan pemanfaatan model AI yang memajukan inovasi di seluruh perusahaan secara bertanggung jawab. watsonx AI dan platform data IBM memiliki proses menyeluruh dalam membangun serta menguji model dasar dan AI generatif. Untuk model yang dikembangkan IBM, kami mencari dan menghapus duplikasi. Selain itu, kami menggunakan daftar blokir URL, filter untuk konten yang tidak pantas dan kualitas dokumen, pemisahan kalimat, dan teknik tokenisasi, semuanya sebelum pelatihan model.

Selama proses pelatihan data, kami berupaya mencegah ketidakselarasan output model dan menggunakan penyesuaian yang diawasi agar dapat mengikuti instruksi yang lebih baik, sehingga model dapat digunakan untuk menyelesaikan tugas perusahaan melalui rekayasa prompt. Kami terus mengembangkan model Granite dalam beberapa arah, termasuk modalitas lain, konten spesifik industri, dan anotasi data tambahan untuk pelatihan. Di saat yang sama, menerapkan pertahanan perlindungan data secara berkala dan berkelanjutan untuk model yang dikembangkan IBM.

Mengingat pesatnya perubahan lingkungan teknologi AI generatif, proses ujung-ke-ujung kami diperkirakan akan terus berkembang dan lebih baik. Sebagai bukti ketelitian yang dilakukan IBM dalam pengembangan dan pengujian model dasarnya, perusahaan memberikan ganti rugi hak kekayaan intelektual kontraktual standar untuk model yang dikembangkan IBM, serupa dengan yang disediakan untuk produk perangkat keras dan produk piranti lunak IBM.

Selain itu, berbeda dengan beberapa penyedia model bahasa besar lainnya dan selaras dengan pendekatan standar IBM mengenai ganti rugi, IBM tidak mewajibkan pelanggannya untuk mengganti rugi IBM atas penggunaan (oleh pelanggan) model yang dikembangkan oleh IBM. Serta selaras dengan pendekatan IBM terhadap kewajiban ganti ruginya, IBM tidak membatasi tanggung jawab ganti ruginya untuk model yang dikembangkan oleh IBM.

Model watsonx saat ini yang berada di bawah perlindungan ini meliputi:

(1) Model khusus enkoder dari lini Slate.

(2) Model khusus dekoder dari lini Granite.

Pelajari selengkapnya tentang pemberian lisensi untuk model Granite

¹Pada 29 April 2026, model bahasa, visi, ucapan, penyematan, dan pengawas Granite yang dirilis sedang ditandatangani secara kriptografis.

²Sertifikasi ISO diberikan untuk Granite AI Management System (AIMS) dari model bahasa Granite. Sertifikat ini dapat ditemukan di sini: https://www.schellman.com/certificate-directory pada sertifikat No. 1102257-1.