Pilih model IBM Granite, sumber terbuka, atau pihak ketiga yang paling sesuai untuk bisnis Anda dan terapkan secara on premises atau di cloud.
Pilih model yang paling sesuai dengan contoh penggunaan Anda, pertimbangan anggaran, minat regional, dan profil risiko.
Disesuaikan untuk bisnis, rangkaian model IBM Granite yang terbuka, berkinerja, dan tepercaya memberikan kinerja luar biasa dengan harga bersaing, tanpa mengorbankan keamanan.
Model Llama adalah model bahasa besar terbuka dan efisien yang dirancang untuk fleksibilitas dan kinerja yang tangguh di berbagai tugas bahasa alami.
Model Mistral adalah model bahasa yang cepat, berkinerja baik, dan berbobot terbuka yang dirancang untuk modularitas dan dioptimalkan untuk pembuatan teks, penalaran, dan aplikasi multibahasa.
Ada beberapa model dasar dari penyedia lain yang tersedia di watsonx.ai.
Apa yang terjadi ketika Anda melatih model AI yang tangguh dengan data unik milik Anda sendiri? Pengalaman pelanggan yang lebih baik dan nilai yang lebih cepat dengan AI. Jelajahi semua kisah ini dan lihat caranya.
Wimbledon menggunakan model dasar watsonx.ai untuk melatih AI-nya untuk membuat komentar tenis.
Recording Academy menggunakan AI Stories dengan IBM watsonx untuk membuat dan meningkatkan konten editorial mengenai nominasi GRAMMY.
The Masters menggunakan watsonx.ai untuk menghadirkan insight yang didukung AI yang dikombinasikan dengan pendapat pakar ke platform digital.
AddAI.Life menggunakan watsonx.ai untuk mengakses model bahasa besar sumber terbuka tertentu untuk membangun asisten virtual berkualitas lebih tinggi.
gpt-oss-120b
OpenAI
Penerapan on premises atau edge pribadi, alur kerja penalaran, penggunaan alat (mis. pencarian, eksekusi kode), rantai pemikiran yang dapat disesuaikan, output terstruktur, upaya penalaran yang dapat disesuaikan
128K
Input 0,15 token
Output 0,60 token
granite-3-3-8b-instruct
IBM
Mendukung penalaran dan perencanaan, question and answer (Q&A), dukungan isi di tengah, peringkasan, klasifikasi, pembuatan, ekstraksi, RAG, dan tugas pengodean.
128k
0,20
granite-3-2-8b-instruct
IBM
Mendukung penalaran dan perencanaan, Tanya Jawab, ringkasan, klasifikasi, pembangkitan, ekstraksi, RAG dan tugas pengodean.
128k
0,20
granite-vision-3-2-2b
IBM
Mendukung contoh penggunaan gambar ke teks untuk bagan, grafik dan analisis infografis, serta Tanya Jawab konteks.
16.384
0,10
granite-3-2b-instruct (v3.1)
IBM
Mendukung tugas Tanya Jawab, ringkasan, klasifikasi, pembuatan, ekstraksi, RAG, dan pengodean.
128k
0,10
granite-3-8b-instruct (v3.1)
IBM
Mendukung tugas Tanya Jawab, ringkasan, klasifikasi, pembuatan, ekstraksi, RAG, dan pengodean.
128k
0,20
granite-guardian-3-8b (v3.1)
IBM
Mendukung deteksi HAP/atau PII, jailbreaking, bias, kekerasan dan konten berbahaya lainnya.
128k
0,20
granite-guardian-3-2b (v3.1)
IBM
Mendukung deteksi HAP atau PII, jailbreaking, bias, kekerasan dan konten berbahaya lainnya.
128k
0,10
granite-13b-instruct
IBM
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG.
8192
0,60
granite-8b-code-instruct
IBM
Model khusus tugas untuk kode dengan menghasilkan, menjelaskan, dan menerjemahkan kode dari prompt bahasa alami.
128k
0,60
granite-8b-japanese
IBM
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, terjemahan, dan tugas-tugas RAG dalam bahasa Jepang.
4096
0,60
*Harga yang ditampilkan bersifat indikatif, dapat berbeda di setiap negara, tidak termasuk pajak dan bea yang berlaku, serta tergantung pada ketersediaan penawaran produk di wilayah setempat.
llama-4-scout-17b-16e-instruct
Meta
Penalaran multimodal, pemrosesan konteks panjang (token 10 juta), pembuatan dan analisis kode, operasi multibahasa (mendukung 200 bahasa), STEM, dan penalaran logis.
128k
Pratinjau gratis
llama-4-maverick-17b-128e-instruct-fp8
Meta
Penalaran multimodal, pemrosesan konteks panjang (token 10 juta), pembuatan dan analisis kode, operasi multibahasa (mendukung 200 bahasa), STEM, dan penalaran logis.
128k
Input: 0,35 / Output: 1,40
llama-3-3-70b-instruct
Meta
Mendukung tugas Q&A, ringkasan, pembuatan, pengodean, klasifikasi, ekstraksi, dan penerjemahan, serta RAG dalam bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.
128k
0.71
llama-3-2-90b-vision-instruct
Meta
Mendukung pengenalan teks dalam gambar, transkripsi gambar ke teks (OCR) termasuk tulisan tangan, ekstraksi dan pemrosesan data, pemahaman konteks dalam tanya jawab, dan identifikasi objek.
128k
2,00
llama-3-2-11b-vision-instruct
Meta
Mendukung pengenalan teks dalam gambar, transkripsi gambar ke teks (OCR) termasuk tulisan tangan, ekstraksi dan pemrosesan data, pemahaman konteks dalam tanya jawab, dan identifikasi objek.
128k
0,35
llama-guard-3-11b-vision
Meta
Mendukung pemfilteran gambar, deteksi HAP atau PII, dan penyaringan konten berbahaya.
128k
0,35
llama-3-2-1b-instruct
Meta
Mendukung tugas Q&A, ringkasan, pembuatan, pengodean, klasifikasi, ekstraksi, dan penerjemahan, serta RAG dalam bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.
128k
0,10
llama-3-2-3b-instruct
Meta
Mendukung tugas Q&A, ringkasan, pembuatan, pengodean, klasifikasi, ekstraksi, dan penerjemahan, serta RAG dalam bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.
128k
0,15
llama-3-405b-instruct
Meta
Mendukung tugas Q&A, ringkasan, pembuatan, pengodean, klasifikasi, ekstraksi, dan penerjemahan, serta RAG dalam bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand. |
128k
Input: 5,00/Hasil: 16,00
*Harga yang ditampilkan bersifat indikatif, dapat berbeda di setiap negara, tidak termasuk pajak dan bea yang berlaku, serta tergantung pada ketersediaan penawaran produk di wilayah setempat.
mistral-medium-2505
Mistral AI
Mendukung pengodean, teks gambar, transkripsi gambar ke teks, pemanggilan fungsi, ekstraksi dan pemrosesan data, konteks Q&A, penalaran matematis
128k
Input: 3,00/hasil: 10,00
mistral-small-3-1-24b-instruct-2503
Mistral AI
Mendukung keterangan gambar, transkripsi gambar ke teks, pemanggilan fungsi, ekstraksi dan pemrosesan data, konteks Q&A dan identifikasi objek
128k
Input: 0,10/ Output: 0,30
pixtral-12b
Mistral AI
Mendukung pengenalan teks dalam gambar, transkripsi gambar ke teks (OCR) termasuk tulisan tangan, ekstraksi dan pemrosesan data, pemahaman konteks dalam tanya jawab, dan identifikasi objek.
128k
0,35
mistral-large-2
Mistral AI
Mendukung Q&A, peringkasan, pembuatan, pengodean, klasifikasi, ekstraksi, penerjemahan, dan tugas RAG dalam bahasa Prancis, Jerman, Italia, Spanyol, dan Inggris.
128k*
Input: 3,00/hasil: 10,00
*Harga yang ditampilkan bersifat indikatif, dapat berbeda di setiap negara, tidak termasuk pajak dan bea yang berlaku, serta tergantung pada ketersediaan penawaran produk di wilayah setempat.
allam-1-13b-instruct
SDAIA
Mendukung Tanya Jawab, ringkasan, klasifikasi, pembuatan, ekstraksi, RAG, dan terjemahan dalam bahasa Arab.
4096
1,80
jais-13b-chat (Arabic)
core42
Mendukung Q&A, ringkasan, klasifikasi, pembuatan, ekstraksi, dan terjemahan dalam bahasa Arab.
2048
1,80
flan-t5-xl-3b
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG. Penyetelan prompt dapat dilakukan.
4096
0,60
flan-t5-xxl-11b
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG.
4096
1,80
flan-ul2-20b
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG.
4096
5,00
elyza-japanese-llama-2-7b-instruct
ELYZA
Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas penerjemahan.
4096
1,80
*Harga yang ditampilkan bersifat indikatif, dapat berbeda di setiap negara, tidak termasuk pajak dan bea yang berlaku, serta tergantung pada ketersediaan penawaran produk di wilayah setempat.
Gunakan model embedding yang dikembangkan dan tersedia sebagai sumber terbuka oleh IBM, yang telah diterapkan di IBM watsonx.ai, untuk mendukung generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen. Atau pilih penyedia model embedding pihak ketiga.
granite-embedding-107m-multilingual
IBM
Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.
512
0,10
granite-embedding-278m-multilingual
IBM
Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.
512
0,10
slate-125m-english-rtrvr-v2
IBM
Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.
512
0,10
slate-125m-english-rtrvr
IBM
Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.
512
0,10
slate-30m-english-rtrvr-v2
IBM
Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.
512
0,10
slate-30m-english-rtrvr
IBM
Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.
512
0,10
*Harga yang ditampilkan bersifat indikatif, dapat berbeda di setiap negara, tidak termasuk pajak dan bea yang berlaku, serta tergantung pada ketersediaan penawaran produk di wilayah setempat.
all-mini-l6-v2
Microsoft
Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.
256
0,10
all-minilm-l12-v2
OS-NLP-CV
Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.
256
0,10
multilingual-e5-large
Intel
Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.
512
0,10
*Harga yang ditampilkan bersifat indikatif, dapat berbeda di setiap negara, tidak termasuk pajak dan bea yang berlaku, serta tergantung pada ketersediaan penawaran produk di wilayah setempat.
* Panjang konteks yang didukung oleh penyedia model, tetapi panjang konteks sebenarnya di platform terbatas. Untuk informasi lebih lanjut, lihat Dokumentasi.
Inferensi ditagih dalam Unit Sumber Daya. 1 Unit Sumber Daya adalah 1.000 token. Token input dan penyelesaian dikenakan tarif yang sama. 1.000 token umumnya berisi sekitar 750 kata.
Tidak semua model tersedia di semua wilayah. Lihat dokumentasi kami untuk detailnya.
Panjang konteks dinyatakan dalam token.
Pernyataan IBM mengenai rencana, arahan, dan maksudnya dapat berubah atau ditarik tanpa pemberitahuan atas kebijakannya sendiri. Lihat Harga untuk detail selengkapnya. Kecuali ditentukan lain dalam Harga perangkat lunak, semua fitur, kemampuan, dan potensi pembaruan merujuk secara eksklusif pada SaaS. IBM tidak membuat pernyataan bahwa fitur dan kemampuan SaaS dan perangkat lunak adalah sama.