Granite 3.1 8B Instruct memberikan peningkatan kinerja yang signifikan dibandingkan Granite 3.0 8B Instruct. Skor rata-ratanya di seluruh tolok ukur Hugging Face OpenLLM Leaderboard kini termasuk yang tertinggi di antara semua model terbuka di kelasnya.

Kami telah memperluas jendela konteks dari seluruh keluarga model bahasa Granite 3. Model padat terbaru kami (Granite 3.1 8B, Granite 3.1 2B), model MoE (Granite 3.1 3B-A800M, Granite 3.1 1B-A400M) dan model guardrail (Granite Guardian 3.1 8B, Granite Guardian 3.1 2B) semuanya memiliki panjang konteks 128 ribu token.

Kami merilis serangkaian model penyematan yang sepenuhnya baru. Model Granite Embedding yang dioptimalkan untuk pengambilan data baru ditawarkan dalam empat ukuran, mulai dari parameter 30 juta–278 juta. Seperti model generatif, model ini menawarkan dukungan multibahasa dalam 12 bahasa berbeda: Inggris, Jerman, Spanyol, Prancis, Jepang, Portugis, Arab, Ceko, Italia, Korea, Belanda, dan Mandarin.



. Model Granite Embedding yang dioptimalkan untuk pengambilan data baru ditawarkan dalam empat ukuran, mulai dari parameter 30 juta–278 juta. Seperti model generatif, model ini menawarkan Inggris, Jerman, Spanyol, Prancis, Jepang, Portugis, Arab, Ceko, Italia, Korea, Belanda, dan Mandarin. .

Granite Guardian 3.1 8B dan 2B dilengkapi kemampuan deteksi halusinasi dalam pemanggilan fungsi baru, yang memungkinkan peningkatan kontrol dan observabilitas bagi agen yang membuat panggilan fungsi eksternal.

Semua model Granite 3.1, Granite Guardian 3.1, dan Granite Embedding adalah sumber terbuka di bawah lisensi Apache 2.0.

Entri terbaru dalam seri Granite ini mengikuti peluncuran terbaru IBM, yaitu Docling (kerangka kerja sumber terbuka untuk mempersiapkan dokumen untuk RAG dan aplikasi AI generatif lainnya) dan Bee (kerangka kerja sumber terbuka yang tidak tergantung model untuk AI otonom).

Granite TTM (TinyTimeMixers), rangkaian model deret waktu yang ringkas namun berkinerja tinggi dari IBM, kini tersedia di watsonx.ai melalui rilis beta watsonx.ai Timeseries Forecasting API dan SDK.

Model Granite 3.1 sekarang tersedia di IBM watsonx.ai, serta melalui mitra platform termasuk (dalam urutan sesuai abjad) Docker, Hugging Face, LM Studio, Ollama, dan Replicate.

Granite 3.1 juga akan dimanfaatkan secara internal oleh mitra perusahaan: Samsung mengintegrasikan model Granite tertentu ke dalam platform SDS-nya; Lockheed Martin mengintegrasikan model Granite 3.1 ke dalam peralatan AI Factory-nya, yang digunakan oleh lebih dari 10.000 pengembang dan engineer.

Hari ini menandai peluncuran IBM Granite 3.1, pembaruan terkini untuk seri Granite kami yang berisi model bahasa terbuka, berkinerja tinggi, dan dioptimalkan untuk perusahaan. Rangkaian perbaikan, penambahan, dan kemampuan baru ini berfokus terutama pada peningkatan kinerja, akurasi, dan akuntabilitas di contoh penggunaan penting perusahaan seperti penggunaan alat, generasi dengan dukungan pengambilan data (RAG), dan alur kerja agen AI yang dapat diskalakan.

Granite 3.1 dibangun berdasarkan momentum koleksi Granite 3.0 yang baru saja diluncurkan. IBM akan terus merilis model dan fungsionalitas terbaru untuk seri Granite 3 dalam beberapa bulan mendatang, dengan kemampuan multimodal baru yang dijadwalkan untuk dirilis pada Q1 2025.

Model-model Granite baru ini bukan satu-satunya kontribusi IBM terkini yang penting bagi ekosistem sumber terbuka LLM. Rilis hari ini melengkapi serangkaian peluncuran sumber terbuka inovatif terkini, mulai dari kerangka kerja fleksibel untuk mengembangkan agen AI hingga toolkit intuitif untuk membuka informasi penting yang tersimpan dalam PDF, slide presentasi, dan format file lain yang sulit dicerna oleh model. Menggunakan perangkat dan kerangka kerja ini bersama-sama dengan model Granite 3.1 menawarkan kemampuan yang lebih maju bagi pengembang untuk RAG, agen AI, dan alur kerja berbasis LLM lainnya.

Seperti biasa, komitmen historis IBM terhadap sumber terbuka tercermin dalam lisensi sumber terbuka yang permisif dan standar untuk setiap penawaran yang dibahas dalam artikel ini.