Beranda

AI and ML

watsonx

watsonx.ai

Model dasar di watsonx.ai 
Jelajahi pustaka model dasar IBM di watsonx untuk menskalakan AI gen
Pelajari tentang Granite Mulai uji coba gratis Anda
Tangkapan layar produk model dasar watsonx.ai

Memperkenalkan model Granite generasi ketiga dari IBM: model bahasa terbuka yang andal, berkinerja tinggi, dan tepercaya

Percepat transformasi AI Anda dengan model bahasa generasi ketiga kami yang andal dan siap digunakan di lingkungan perusahaan

Baca blognya untuk jelajahi Granite
Model dasar dengan kekuatan pilihan

Model IBM  watsonxdirancang untuk perusahaan dan dioptimalkan untuk domain bisnis dan contoh penggunaan bertarget. Melalui studio AI IBM watsonx.aikami menawarkan pilihan model dasar kelas enterprise yang hemat biaya yang dikembangkan oleh IBM, model sumber terbuka dan model yang bersumber dari penyedia pihak ketiga untuk membantu klien dan mitra meningkatkan dan mengoperasionalkan kecerdasan buatan (AI) lebih cepat dengan risiko minimal. Anda dapat menerapkan model AI di mana pun beban kerja Anda berada, baik lokal maupun di hybrid cloud.

IBM mengambil pendekatan yang berbeda untuk memberikan model dasar kelas enterprise:

  • Terbuka: Hadirkan model IBM terbaik di kelasnya dan sumber terbuka yang telah terbukti ke pustaka model dasar watsonx atau pustaka Anda.
  • Tepercaya: Melatih model pada data tepercaya dan teregulasi untuk aplikasi yang membutuhkan transparansi, tata kelola, dan kinerja tingkat perusahaan.
  • Ditargetkan: Desain untuk perusahaan dan dioptimalkan untuk domain bisnis dan contoh penggunaan yang ditargetkan.
  • Pemberdayaan: Memberdayakan klien dengan pilihan model dengan harga bersaing untuk membangun AI yang paling sesuai dengan kebutuhan bisnis dan profil risiko mereka yang unik.
Model IBM Point-of-View: Pendekatan yang berbeda untuk model dasar AI
Granite 3.1 sekarang tersedia di perpustakaan model pondasi watsonx.
Yang baru
Fitur model baru
Baru di Granite: Pembaruan Model Granite 3.1, model penyematan terbaru, dan berbagai peningkatan lainnya
Fitur model baru
Model Llama 3.3 70b Instruct dari Meta kini tersedia di watsonx.ai
Fitur model baru
Model dasar lokal dari Mistral AI sekarang tersedia di watsonx
Buku elektronik: Jelajahi cara memilih model dasar yang tepat
Model IBM

Perpustakaan model dasar IBM watsonx memberikan Anda pilihan dan fleksibilitas untuk memilih model yang paling sesuai dengan kebutuhan bisnis, kepentingan regional, dan profil risiko Anda dari perpustakaan model dengan hak milik, sumber terbuka, dan model pihak ketiga.

Granite, dikembangkan oleh IBM Research

IBM Granite adalah kelompok model AI kami yang terbuka, berkinerja tinggi, dan tepercaya, yang dirancang untuk bisnis dan dioptimalkan untuk menskalakan aplikasi AI Anda. Granite 3.1 menghadirkan model sumber terbuka yang dirancang untuk kebutuhan perusahaan, menawarkan kinerja luar biasa dalam berbagai tugas bisnis, termasuk keamanan siber dan RAG, serta unggul dalam berbagai tolok ukur.

  1. Granite 3.1 8b dan 2b: Instruksikan model yang dilatih pada data berkualitas tinggi yang dioptimalkan untuk bahasa alami dan contoh penggunaan perusahaan
  2. Granite Guardian: Pagar pembatas berbasis LLM yang dirancang untuk deteksi konten berbahaya seperti kebencian, kata-kata kotor, bias sosial, dll.
  3. Granite 13b chat: Model chat dioptimalkan untuk contoh penggunaan percakapan dan bekerja dengan baik dengan agen virtual dan aplikasi obrolan
  4. Granite 13b Menginstruksikan: Model instruksional yang dilatih dengan data keuangan berkualitas tinggi untuk memberikan kinerja optimal dalam berbagai tugas di domain keuangan
  5. Granite Code: Kumpulan model dengan ukuran parameter mulai dari 3B hingga 34B, dilatih pada 116 bahasa pemrograman
  6. Granite multilingual: Dilatih untuk memahami dan menghasilkan teks dalam bahasa Inggris, Jerman, Spanyol, Prancis, dan Portugis
  7. Granit Jepang: Dirancang untuk melakukan tugas bahasa pada teks Jepang
Model Penyematan IBM

Gunakan model penyematan yang dikembangkan dan tersedia sebagai sumber terbuka oleh IBM, yang telah diterapkan di IBM watsonx.ai. untuk mendukung generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

  • Granite-embedding-30M-english
  • Granite-embedding-125M-english
  • Granite-embedding-107M-multilingual
  • Granite-embedding-278M-multilingual
Coba watsonx.ai gratis
Laporan IBM Research
Lihat cara model Granite dilatih dan sumber data digunakan
Mengapa IBM Granite?         Pelajari Granite lebih lanjut
Buka

Pilih model yang tepat, dari submiliar hingga parameter 34B, sumber terbuka di bawah Apache 2.0.

Berkinerja baik

Jangan mengorbankan kinerja demi menghemat biaya. Granite mengungguli model sejenis di berbagai tugas perusahaan.

Tepercaya

Bangun AI yang bertanggung jawab dengan serangkaian kemampuan deteksi risiko dan bahaya yang komprehensif, transparansi, dan perlindungan IP.

Koleksi model dasar

Pilih model dasar generatif yang paling sesuai dengan kebutuhan Anda. Setelah memiliki daftar singkat model untuk contoh penggunaan Anda, uji model secara sistematis menggunakan teknik rekayasa prompt untuk melihat model mana yang secara konsisten memberikan hasil yang diinginkan.

Lihat informasi harga watsonx lainnya
Nama model Penyedia Contoh penggunaan Panjang konteks Harga USD/1 juta token*

granite-3-2b-instruct (v3.1)

Baru
Model unggulan

IBM

Mendukung Question and Answer (Q&A), ringkasan, klasifikasi, pembuatan, ekstraksi, RAG, dan tugas pengodean. 

128k

0,10

granite-3-8b-instruct (v3.1)

Baru
Model unggulan

IBM

Mendukung Question and Answer (Q&A), ringkasan, klasifikasi, pembuatan, ekstraksi, RAG, dan tugas pengodean. 

128k

0,20

granite-guardian-3-8b (v3.1)

Baru
Model unggulan

IBM

Mendukung deteksi HAP/PII, jailbreaking, bias, kekerasan, dan konten berbahaya lainnya.

128k

0,20

granite-guardian-3-2b (v3.1)

Baru
Model unggulan

IBM

Mendukung deteksi HAP/PII, jailbreaking, bias, kekerasan, dan konten berbahaya lainnya.

128k

0,10

granite-20b-multilingual

Tidak digunakan lagi

IBM

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, penerjemahan, dan tugas-tugas RAG dalam bahasa Prancis, Jerman, Portugis, Spanyol, dan Inggris.

8192

0,60

granite-13b-chat 

Tidak digunakan lagi

IBM

Mendukung pertanyaan dan jawaban (Q&A), pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG. 

 

8192

0,60

granite-13b-instruct

IBM 

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG.

8192

0,60

granite-34b-code-instruct

IBM

Model khusus tugas untuk kode dengan menghasilkan, menjelaskan, dan menerjemahkan kode dari prompt bahasa alami.

 

8192

0,60

granite-20b-code-instruct

IBM

Model khusus tugas untuk kode dengan menghasilkan, menjelaskan, dan menerjemahkan kode dari prompt bahasa alami.

 

8192

0,60

granite-8b-code-instruct

IBM

Model khusus tugas untuk kode dengan menghasilkan, menjelaskan, dan menerjemahkan kode dari prompt bahasa alami.

 

128k

0,60

granite-3b-code-instruct

IBM

Model khusus tugas untuk kode dengan menghasilkan, menjelaskan, dan menerjemahkan kode dari prompt bahasa alami.

 

128k

0,60

granite-8b-japanese

IBM

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, penerjemahan, dan tugas-tugas RAG dalam bahasa Jepang. 

4096

0,60

llama-3-3-70b-instruct

Baru

Meta

Mendukung tugas Q&A, pembuatan ringkasan, pembuatan konten, pengodean, klasifikasi, ekstraksi, dan penerjemahan, serta RAG dalam bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand

128k

0.71

llama-3-2-90b-vision-instruct

Baru

Meta

Mendukung pengenalan teks dalam gambar, transkripsi gambar ke teks (OCR), termasuk tulisan tangan, ekstraksi dan pemrosesan data, pemahaman konteks dalam tanya jawab, serta identifikasi objek

128k

2,00

llama-3-2-11b-vision-instruct

Baru

Meta

Mendukung pengenalan teks dalam gambar, transkripsi gambar ke teks (OCR), termasuk tulisan tangan, ekstraksi dan pemrosesan data, pemahaman konteks dalam tanya jawab, serta identifikasi objek

128k

0,35

llama-guard-3-11b-vision

Baru

Meta

Mendukung penyaringan gambar, deteksi HAP/PII, penyaringan konten berbahaya

128k

0,35

llama-3-2-1b-instruct

Baru

Meta

Mendukung tugas Q&A, pembuatan ringkasan, pembuatan konten, pengodean, klasifikasi, ekstraksi, dan penerjemahan, serta RAG dalam bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand

128k

0,10

llama-3-2-3b-instruct

Baru

Meta

Mendukung tugas Q&A, pembuatan ringkasan, pembuatan konten, pengodean, klasifikasi, ekstraksi, dan penerjemahan, serta RAG dalam bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand

128k

0,15

llama-3-405b-instruct

Meta

Mendukung tugas seperti Q&A, pembuatan ringkasan, pembuatan konten, pengodean, klasifikasi, ekstraksi, dan penerjemahan, serta RAG dalam bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand

128k

Input: 5,00/Hasil: 16,00

llama-3-1-70b-instruct

Tidak digunakan lagi

Meta

Mendukung Q&A, pembuatan ringkasan, pembuatan konten, pengodean, klasifikasi, ekstraksi, penerjemahan, dan tugas RAG dalam bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.

128k

1,80

llama-3-1-8b-instruct 

Tidak digunakan lagi

Meta

Mendukung Q&A, pembuatan ringkasan, pembuatan konten, pengodean, klasifikasi, ekstraksi, penerjemahan, dan tugas RAG dalam bahasa Inggris, Jerman, Prancis, Italia, Portugis, Hindi, Spanyol, dan Thailand.

128k

0,60

llama-3-8b-instruct

Tidak digunakan lagi

Meta

Mendukung tugas ringkasan, klasifikasi, pembuatan, ekstraksi, dan penerjemahan.

8192

0,60

llama-3-70b-instruct

Tidak digunakan lagi

Meta

Mendukung RAG, pembuatan konten, pembuatan ringkasan, klasifikasi, tanya jawab, ekstraksi informasi, penerjemahan, dan pembuatan kode.

8192

1,80

allam-1-13b-instruct

SDAIA

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, RAG, dan penerjemahan dalam bahasa Arab.

4096

1,80

codellama-34b-instruct

Tidak digunakan lagi

Meta

Tugaskan model khusus untuk kode dengan membuat dan menerjemahkan kode dari prompt bahasa alami.

16384

1,80

pixtral-12b

Baru

Mistral AI

Mendukung pengenalan teks dalam gambar, transkripsi gambar ke teks (OCR), termasuk tulisan tangan, ekstraksi dan pemrosesan data, pemahaman konteks dalam tanya jawab, serta identifikasi objek

128k

0,35

mistral-large-2

Baru

Mistral AI

Mendukung Q&A, pembuatan ringkasan, pembuatan konten, pengodean, klasifikasi, ekstraksi, penerjemahan, dan tugas RAG dalam bahasa Prancis, Jerman, Italia, Spanyol, dan Inggris.

128k*

Input: 3,00/hasil: 10,00

 Mistral-Small-24B-Instruct-2501

Baru

Mistral AI

Mendukung tugas bahasa, alur kerja agen, RAG, dan banyak lagi dalam lusinan bahasa dengan waktu respons yang cepat.

32768

0,35

mixtral-8x7b-instruct

Mistral AI

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, serta tugas-tugas RAG dan pembuatan kode.

32768

0,60

jais-13b-chat (Arabic)

core42

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan penerjemahan dalam bahasa Arab.

2048

1,80

flan-t5-xl-3b

Google

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG. Penyetelan prompt dapat dilakukan.

4096

0,60

flan-t5-xxl-11b

Google

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG.

4096

1,80

flan-ul2-20b

Google

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas RAG.

4096

5,00

elyza-japanese-llama-2-7b-instruct

ELYZA

Mendukung Q&A, pembuatan ringkasan, klasifikasi, pembuatan konten, ekstraksi, dan tugas-tugas penerjemahan. 

4096

1,80

*Harga yang ditampilkan bersifat indikatif, dapat berbeda di setiap negara, tidak termasuk pajak dan bea yang berlaku, serta tergantung pada ketersediaan penawaran produk di wilayah setempat. 

Menyematkan pustaka model

Model penyematan mengonversi input menjadi representasi vektor padat, yang merepresentasikan karakteristik utama dari input tersebut. Penyematan merepresentasikan hubungan semantik dan sintaksis yang kompleks antara kata-kata dan elemen lainnya dalam ruang vektor.

Nama model Penyedia Contoh penggunaan Panjang konteks Harga USD/1 juta token*

granite-embedding-107m-multilingual

Baru

IBM

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

512

0,10

granite-embedding-278m-multilingual

Baru

IBM

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

512

0,10

slate-125m-english-rtrvr-v2

Baru

IBM

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

512

0,10

slate-125m-english-rtrvr

IBM

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

 

512

0,10

slate-30m-english-rtrvr-v2

Baru

IBM

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

 

512

0,10

slate-30m-english-rtrvr

IBM

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

 

512

0,10

all-mini-l6-v2

Baru

Microsoft

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

256

0,10

all-minilm-l12-v2

OS-NLP-CV

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

256

0,10

multilingual-e5-large

Intel

Tugas generasi dengan dukungan pengambilan data, pencarian semantik, dan perbandingan dokumen.

512

0,10

*Harga yang ditampilkan bersifat indikatif, dapat berbeda di setiap negara, tidak termasuk pajak dan bea yang berlaku, serta tergantung pada ketersediaan penawaran produk di wilayah setempat. 

Cerita klien

Banyak bisnis yang antusias terhadap prospek memanfaatkan model dasar dan ML di satu tempat dengan data mereka sendiri, untuk mempercepat beban kerja AI generatif. 

Wimbledon menggunakan model dasar watsonx.ai untuk melatih AI-nya untuk membuat komentar tenis. Baca studi kasus
The Recording Academy menggunakan AI Stories dengan IBM watsonx untuk membuat dan menskalakan konten editorial tentang penerima nominasi GRAMMY. watsonx menghadirkan insight dan narasi yang didukung AI dalam bahasa Spanyol ke platform digital Turnamen Masters. AddAI.Life menggunakan watsonx.ai untuk mengakses model bahasa besar sumber terbuka tertentu untuk membangun asisten virtual berkualitas lebih tinggi.

Perlindungan Kekayaan Intelektual untuk model AI

IBM percaya dalam penciptaan, penerapan, dan pemanfaatan model AI yang memajukan inovasi di seluruh perusahaan secara bertanggung jawab. Portofolio watsonx AI IBM memiliki proses menyeluruh dalam membangun serta menguji model dasar dan AI generatif. Untuk model yang dikembangkan IBM, kami mencari dan menghapus duplikasi. Selain itu, kami menggunakan daftar blokir URL, filter untuk konten yang tidak pantas dan kualitas dokumen, pemisahan kalimat, dan teknik tokenisasi, semuanya sebelum pelatihan model.

Selama proses pelatihan data, kami berupaya mencegah ketidakselarasan hasil model dan menggunakan penyesuaian yang diawasi agar dapat mengikuti instruksi yang lebih baik, sehingga model dapat digunakan untuk menyelesaikan tugas perusahaan melalui rekayasa prompt. Kami terus mengembangkan model Granite dalam beberapa arah, termasuk modalitas lain, konten spesifik industri, dan anotasi data tambahan untuk pelatihan. Di saat yang sama, menerapkan pertahanan perlindungan data secara berkala dan berkelanjutan untuk model yang dikembangkan IBM.  

Mengingat pesatnya perubahan lingkungan teknologi AI generatif, proses ujung-ke-ujung kami diperkirakan akan terus berkembang dan lebih baik. Sebagai bukti ketelitian yang dilakukan IBM dalam pengembangan dan pengujian model dasarnya, perusahaan memberikan ganti rugi hak kekayaan intelektual kontraktual standar untuk model yang dikembangkan IBM, serupa dengan yang disediakan untuk produk perangkat keras dan produk piranti lunak IBM.

Selain itu, berbeda dengan beberapa penyedia model bahasa besar lainnya dan selaras dengan pendekatan standar IBM mengenai ganti rugi, IBM tidak mewajibkan pelanggannya untuk mengganti rugi IBM atas penggunaan (oleh pelanggan) model yang dikembangkan oleh IBM. Serta selaras dengan pendekatan IBM terhadap kewajiban ganti ruginya, IBM tidak membatasi tanggung jawab ganti ruginya untuk model yang dikembangkan oleh IBM.

Model watsonx saat ini yang berada di bawah perlindungan ini meliputi:

(1) Model khusus enkoder dari lini Slate.

(2) Model khusus dekoder dari lini Granite.

Pelajari selengkapnya tentang pemberian lisensi untuk model Granite

Ambil langkah selanjutnya

Ambil langkah selanjutnya untuk mulai mengoperasionalkan dan menskalakan AI generatif dan machine learning untuk bisnis.

Mulai uji coba gratis Anda Pesan demo langsung
Cara penelusuran lainnya Terhubung dengan Komunitas IBM Dokumentasi SaaS Dokumentasi perangkat lunak Dukungan
Catatan kaki

*Panjang konteks yang didukung oleh penyedia model, tetapi panjang konteks aktual pada platform terbatas. Untuk informasi lebih lanjut, lihat Dokumentasi.

Inferensi ditagih dalam Unit Sumber Daya. 1 Unit Sumber Daya adalah 1.000 token. Token input dan penyelesaian dikenakan tarif yang sama. 1.000 token umumnya berisi sekitar 750 kata.

Tidak semua model tersedia di semua wilayah, lihat dokumentasi kami untuk detailnya.

Panjang konteks dinyatakan dalam token.

Pernyataan IBM mengenai rencana, arahan, dan maksudnya dapat berubah atau ditarik tanpa pemberitahuan dan atas kebijakannya sendiri. Lihat Harga untuk detail selengkapnya. Kecuali ditentukan lain dalam Harga perangkat lunak, semua fitur, kemampuan, dan potensi pembaruan merujuk secara eksklusif pada SaaS. IBM tidak membuat pernyataan bahwa fitur dan kemampuan SaaS dan perangkat lunak adalah sama.