Model Dasar - IBM watsonx.ai

Pilih model yang Anda butuhkan

Pilih model IBM Granite, sumber terbuka, atau pihak ketiga yang paling sesuai untuk bisnis Anda dan terapkan secara on premises atau di cloud.

POV IBM pada model AI

Pilih model dasar yang tepat

Apa yang baru?

Granite 3.3 sekarang tersedia di perpustakaan model dasar watsonx.

Mistral Medium 3 sekarang tersedia di watsonx.ai

Fitur model baru

Meta Llama 4 Maverick dan Llama 4 Scout sekarang tersedia di watsonx.ai

Fitur model baru

Model Granite 3.3 baru memiliki kemampuan speech to text dan peningkatan kinerja model bahasa

Fitur model baru

Koleksi model dasar

Pilih model yang paling sesuai dengan contoh penggunaan Anda, pertimbangan anggaran, minat regional, dan profil risiko.

Lihat perpustakaan model embedding

Model IBM

Disesuaikan untuk bisnis, rangkaian model IBM Granite yang terbuka, berkinerja, dan tepercaya memberikan kinerja luar biasa dengan harga bersaing, tanpa mengorbankan keamanan.

Lihat perpustakaan model IBM

Pelajari Granite lebih lanjut

Model Meta Llama

Model Llama adalah model bahasa besar terbuka dan efisien yang dirancang untuk fleksibilitas dan kinerja yang tangguh di berbagai tugas bahasa alami.

Lihat pustaka model Meta

Pelajari lebih lanjut kemitraan kami

Model AI Mistral

Model Mistral adalah model bahasa yang cepat, berkinerja baik, dan berbobot terbuka yang dirancang untuk modularitas dan dioptimalkan untuk pembuatan teks, penalaran, dan aplikasi multibahasa.

Lihat pustaka model Mistral

Penyedia model pihak ketiga lainnya

Ada beberapa model dasar dari penyedia lain yang tersedia di watsonx.ai.

Lihat pustaka model

Cerita klien

Apa yang terjadi ketika Anda melatih model AI yang tangguh dengan data unik milik Anda sendiri? Pengalaman pelanggan yang lebih baik dan nilai yang lebih cepat dengan AI. Jelajahi semua kisah ini dan lihat caranya.

Wimbledon

Wimbledon menggunakan model dasar watsonx.ai untuk melatih AI-nya untuk membuat komentar tenis.

Baca studi kasus

Recording Academy

Recording Academy menggunakan AI Stories dengan IBM watsonx untuk membuat dan meningkatkan konten editorial mengenai nominasi GRAMMY.

Baca pengumumannya

The Masters

The Masters menggunakan watsonx.ai untuk menghadirkan insight yang didukung AI yang dikombinasikan dengan pendapat pakar ke platform digital.

Baca pengumumannya

AddAI.Life

AddAI.Life menggunakan watsonx.ai untuk mengakses model bahasa besar sumber terbuka tertentu untuk membangun asisten virtual berkualitas lebih tinggi.

Baca studi kasus

Model dasar IBM

Lihat cara model Granite dilatih (PDF)

Pelajari Granite lebih lanjut

Nama model

Penyedia

Contoh penggunaan

Panjang konteks

Harga

USD/1 juta token*

gpt-oss-120b

OpenAI

Penerapan on premises atau edge pribadi, alur kerja penalaran, penggunaan alat (mis. pencarian, eksekusi kode), rantai pemikiran yang dapat disesuaikan, output terstruktur, upaya penalaran yang dapat disesuaikan

128K

Input 0,15 token
Output 0,60 token

granite-3-3-8b-instruct

Baru

Model unggulan

IBM

Mendukung penalaran dan perencanaan, question and answer (Q&A), dukungan isi di tengah, peringkasan, klasifikasi, pembuatan, ekstraksi, RAG, dan tugas pengodean.

128k

0,20

granite-3-2-8b-instruct

IBM

Mendukung penalaran dan perencanaan, Tanya Jawab, ringkasan, klasifikasi, pembangkitan, ekstraksi, RAG dan tugas pengodean.

128k

0,20

granite-vision-3-2-2b

IBM

Mendukung contoh penggunaan gambar ke teks untuk bagan, grafik dan analisis infografis, serta Tanya Jawab konteks.

16.384

0,10

granite-3-2b-instruct (v3.1)

IBM

Mendukung tugas Tanya Jawab, ringkasan, klasifikasi, pembuatan, ekstraksi, RAG, dan pengodean.

128k

0,10

granite-3-8b-instruct (v3.1)

Model unggulan

IBM

Mendukung tugas Tanya Jawab, ringkasan, klasifikasi, pembuatan, ekstraksi, RAG, dan pengodean.

128k

0,20

granite-guardian-3-8b (v3.1)

IBM

Mendukung deteksi HAP/atau PII, jailbreaking, bias, kekerasan dan konten berbahaya lainnya.

128k

0,20

granite-guardian-3-2b (v3.1)

Tidak digunakan lagi

IBM

Mendukung deteksi HAP atau PII, jailbreaking, bias, kekerasan dan konten berbahaya lainnya.

128k

0,10

granite-13b-instruct

Tidak digunakan lagi

IBM

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG.

8192

0,60

granite-8b-code-instruct

IBM

Model khusus tugas untuk kode dengan menghasilkan, menjelaskan, dan menerjemahkan kode dari prompt bahasa alami.

128k

0,60

granite-8b-japanese

Tidak digunakan lagi

IBM

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, terjemahan, dan tugas-tugas RAG dalam bahasa Jepang.

4096

0,60

*Harga yang ditampilkan bersifat indikatif, dapat berbeda di setiap negara, tidak termasuk pajak dan bea yang berlaku, serta tergantung pada ketersediaan penawaran produk di wilayah setempat.

Model meta

Pelajari lebih lanjut kemitraan kami

Nama model

Penyedia

Contoh penggunaan

Panjang konteks

Harga

USD/1 juta token*

llama-4-scout-17b-16e-instruct

Baru

Meta

Penalaran multimodal, pemrosesan konteks panjang (token 10 juta), pembuatan dan analisis kode, operasi multibahasa (mendukung 200 bahasa), STEM, dan penalaran logis.

128k

Pratinjau gratis

llama-4-maverick-17b-128e-instruct-fp8

Baru

Meta

Penalaran multimodal, pemrosesan konteks panjang (token 10 juta), pembuatan dan analisis kode, operasi multibahasa (mendukung 200 bahasa), STEM, dan penalaran logis.

128k

Input: 0,35 / Output: 1,40

llama-3-3-70b-instruct

Meta

Mendukung tugas Q&A, ringkasan, pembuatan, pengodean, klasifikasi, ekstraksi, dan penerjemahan, serta RAG dalam bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.

128k

0.71

llama-3-2-90b-vision-instruct

Meta

Mendukung pengenalan teks dalam gambar, transkripsi gambar ke teks (OCR) termasuk tulisan tangan, ekstraksi dan pemrosesan data, pemahaman konteks dalam tanya jawab, dan identifikasi objek.

128k

2,00

llama-3-2-11b-vision-instruct

Meta

Mendukung pengenalan teks dalam gambar, transkripsi gambar ke teks (OCR) termasuk tulisan tangan, ekstraksi dan pemrosesan data, pemahaman konteks dalam tanya jawab, dan identifikasi objek.

128k

0,35

llama-guard-3-11b-vision

Meta

Mendukung pemfilteran gambar, deteksi HAP atau PII, dan penyaringan konten berbahaya.

128k

0,35

llama-3-2-1b-instruct

Meta

Mendukung tugas Q&A, ringkasan, pembuatan, pengodean, klasifikasi, ekstraksi, dan penerjemahan, serta RAG dalam bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.

128k

0,10

llama-3-2-3b-instruct

Meta

Mendukung tugas Q&A, ringkasan, pembuatan, pengodean, klasifikasi, ekstraksi, dan penerjemahan, serta RAG dalam bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.

128k

0,15

llama-3-405b-instruct

Meta

Mendukung tugas Q&A, ringkasan, pembuatan, pengodean, klasifikasi, ekstraksi, dan penerjemahan, serta RAG dalam bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.

128k

Input: 5,00/Hasil: 16,00

*Harga yang ditampilkan bersifat indikatif, dapat berbeda di setiap negara, tidak termasuk pajak dan bea yang berlaku, serta tergantung pada ketersediaan penawaran produk di wilayah setempat.

Model Mistral

Nama model

Penyedia

Contoh penggunaan

Panjang konteks

Harga

USD/1 juta token*

mistral-medium-2505

Baru

Mistral AI

Mendukung pengodean, teks gambar, transkripsi gambar ke teks, pemanggilan fungsi, ekstraksi dan pemrosesan data, konteks Q&A, penalaran matematis

128k

Input: 3,00/hasil: 10,00

mistral-small-3-1-24b-instruct-2503

Baru

Mistral AI

Mendukung keterangan gambar, transkripsi gambar ke teks, pemanggilan fungsi, ekstraksi dan pemrosesan data, konteks Q&A dan identifikasi objek

128k

Input: 0,10/ Output: 0,30

pixtral-12b

Tidak digunakan lagi

Mistral AI

Mendukung pengenalan teks dalam gambar, transkripsi gambar ke teks (OCR) termasuk tulisan tangan, ekstraksi dan pemrosesan data, pemahaman konteks dalam tanya jawab, dan identifikasi objek.

128k

0,35

mistral-large-2

Tidak digunakan lagi

Mistral AI

Mendukung Q&A, peringkasan, pembuatan, pengodean, klasifikasi, ekstraksi, penerjemahan, dan tugas RAG dalam bahasa Prancis, Jerman, Italia, Spanyol, dan Inggris.

128k*

Input: 3,00/hasil: 10,00

*Harga yang ditampilkan bersifat indikatif, dapat berbeda di setiap negara, tidak termasuk pajak dan bea yang berlaku, serta tergantung pada ketersediaan penawaran produk di wilayah setempat.

Model dasar pihak ketiga

Nama model

Penyedia

Contoh penggunaan

Panjang konteks

Harga

USD/1 juta token*

allam-1-13b-instruct

SDAIA

Mendukung Tanya Jawab, ringkasan, klasifikasi, pembuatan, ekstraksi, RAG, dan terjemahan dalam bahasa Arab.

4096

1,80

jais-13b-chat (Arabic)

core42

Mendukung Q&A, ringkasan, klasifikasi, pembuatan, ekstraksi, dan terjemahan dalam bahasa Arab.

2048

1,80

flan-t5-xl-3b

Tidak digunakan lagi

Google

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG. Penyetelan prompt dapat dilakukan.

4096

0,60

flan-t5-xxl-11b

Tidak digunakan lagi

Google

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG.

4096

1,80

flan-ul2-20b

Tidak digunakan lagi

Google

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG.

4096

5,00

elyza-japanese-llama-2-7b-instruct

Tidak digunakan lagi

ELYZA

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas penerjemahan.

4096

1,80

*Harga yang ditampilkan bersifat indikatif, dapat berbeda di setiap negara, tidak termasuk pajak dan bea yang berlaku, serta tergantung pada ketersediaan penawaran produk di wilayah setempat.

Menyematkan pustaka model

Gunakan model embedding yang dikembangkan dan tersedia sebagai sumber terbuka oleh IBM, yang telah diterapkan di IBM watsonx.ai, untuk mendukung generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen. Atau pilih penyedia model embedding pihak ketiga.

Model Penyematan IBM

Nama model

Penyedia

Contoh penggunaan

Panjang konteks

Harga

USD/1 juta token*

granite-embedding-107m-multilingual

Baru

IBM

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

512

0,10

granite-embedding-278m-multilingual

IBM

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

512

0,10

slate-125m-english-rtrvr-v2

IBM

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

512

0,10

slate-125m-english-rtrvr

IBM

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

512

0,10

slate-30m-english-rtrvr-v2

IBM

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

512

0,10

slate-30m-english-rtrvr

IBM

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

512

0,10

*Harga yang ditampilkan bersifat indikatif, dapat berbeda di setiap negara, tidak termasuk pajak dan bea yang berlaku, serta tergantung pada ketersediaan penawaran produk di wilayah setempat.

Model penyematan pihak ketiga

Nama model

Penyedia

Contoh penggunaan

Panjang konteks

Harga

USD/1 juta token*

all-mini-l6-v2

Baru

Microsoft

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

256

0,10

all-minilm-l12-v2

OS-NLP-CV

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

256

0,10

multilingual-e5-large

Intel

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

512

0,10

*Harga yang ditampilkan bersifat indikatif, dapat berbeda di setiap negara, tidak termasuk pajak dan bea yang berlaku, serta tergantung pada ketersediaan penawaran produk di wilayah setempat.

Sumber daya

Cara memilih model dasar AI yang tepat

Lihat buku panduan Granite lengkap

AI generatif dan ML untuk perusahaan

Hugging Face dan IBM bekerja sama dalam sumber terbuka

Kekayaan intelektual

IBM percaya dalam penciptaan, penerapan, dan pemanfaatan model AI yang memajukan inovasi di seluruh perusahaan secara bertanggung jawab. Portofolio IBM watsonx AI memiliki proses menyeluruh untuk membangun dan menguji model dasar dan AI generatif. Untuk model yang dikembangkan IBM, kami mencari dan menghapus duplikasi. Selain itu, kami menggunakan daftar blokir URL, filter untuk konten yang tidak pantas dan kualitas dokumen, pemisahan kalimat, dan teknik tokenisasi, semuanya sebelum pelatihan model.

Selama proses pelatihan data, kami berupaya mencegah ketidakselarasan output model dan menggunakan penyesuaian yang diawasi agar dapat mengikuti instruksi yang lebih baik, sehingga model dapat digunakan untuk menyelesaikan tugas perusahaan melalui rekayasa prompt. Kami terus mengembangkan model Granite dalam beberapa arah, termasuk modalitas lain, konten spesifik industri, dan anotasi data tambahan untuk pelatihan. Di saat yang sama, menerapkan pertahanan perlindungan data secara berkala dan berkelanjutan untuk model yang dikembangkan IBM.

Mengingat pesatnya perubahan lingkungan teknologi AI generatif, proses menyeluruh kami diperkirakan akan terus berkembang dan lebih baik. Sebagai bukti ketelitian yang dilakukan IBM dalam pengembangan dan pengujian model dasarnya, perusahaan memberikan ganti rugi hak kekayaan intelektual kontraktual standar untuk model yang dikembangkan IBM, serupa dengan yang disediakan untuk produk perangkat keras dan produk piranti lunak IBM.

Selain itu, berbeda dengan beberapa penyedia model bahasa besar lainnya dan selaras dengan pendekatan standar IBM mengenai ganti rugi, IBM tidak memerlukan pelanggannya untuk mengganti rugi IBM atas penggunaan (oleh pelanggan) model yang dikembangkan oleh IBM. Serta selaras dengan pendekatan IBM terhadap kewajiban ganti ruginya, IBM tidak membatasi tanggung jawab ganti ruginya untuk model yang dikembangkan oleh IBM.

Model watsonx saat ini yang berada di bawah perlindungan ini meliputi:

(1) Model khusus enkoder dari lini Slate

(2) Model khusus dekoder dari lini Granite

Pelajari lebih lanjut tentang pemberian lisensi untuk model Granite (PDF)

Ambil langkah selanjutnya

Mulailah mengoperasikan dan menskalakan AI generatif dan machine learning untuk bisnis dengan menjelajahi uji coba gratis kami atau memesan demo langsung.

Mulai uji coba gratis Anda

Pesan demo langsung

Cara penelusuran lainnya

Terhubung dengan Komunitas IBM

Baca Dokumentasi SaaS

Baca dokumentasi perangkat lunak

Temukan dukungan

Catatan kaki

^* Panjang konteks yang didukung oleh penyedia model, tetapi panjang konteks sebenarnya di platform terbatas. Untuk informasi lebih lanjut, lihat Dokumentasi.

Inferensi ditagih dalam Unit Sumber Daya. 1 Unit Sumber Daya adalah 1.000 token. Token input dan penyelesaian dikenakan tarif yang sama. 1.000 token umumnya berisi sekitar 750 kata.

Tidak semua model tersedia di semua wilayah. Lihat dokumentasi kami untuk detailnya.

Panjang konteks dinyatakan dalam token.

Pernyataan IBM mengenai rencana, arahan, dan maksudnya dapat berubah atau ditarik tanpa pemberitahuan atas kebijakannya sendiri. Lihat Harga untuk detail selengkapnya. Kecuali ditentukan lain dalam Harga perangkat lunak, semua fitur, kemampuan, dan potensi pembaruan merujuk secara eksklusif pada SaaS. IBM tidak membuat pernyataan bahwa fitur dan kemampuan SaaS dan perangkat lunak adalah sama.

Model dasar di watsonx.ai

Pilih model yang Anda butuhkan

Apa yang baru?

Koleksi model dasar

Cerita klien

Model dasar IBM

Model meta

Model Mistral

Model dasar pihak ketiga

Menyematkan pustaka model

Model Penyematan IBM

Model penyematan pihak ketiga

Sumber daya

Kekayaan intelektual

Catatan kaki