Menskalakan AI generatif dengan pilihan model yang fleksibel

Seorang pria sedang duduk di dekat jendela besar di ruang perpustakaan modern sambil bekerja di laptop.

Seri blog ini mengungkapkan tentang AI generatif (gen AI) perusahaan untuk pemimpin bisnis dan teknologi. Artikel ini menyediakan kerangka kerja sederhana dan prinsip-prinsip panduan untuk perjalanan transformatif kecerdasan buatan (AI) Anda. Dalam blog sebelumnya, kami telah membahas pendekatan yang berbeda dari IBM dalam menghadirkan model-model untuk perusahaan. Di blog ini, kami menyelidiki mengapa pilihan model dasar penting dan bagaimana model tersebut memberdayakan bisnis untuk menskalakan gen AI dengan percaya diri.

Mengapa pilihan model penting?

Dalam dunia dinamis gen AI, pendekatan satu ukuran untuk semua tidak memadai. Ketika bisnis berupaya memanfaatkan kekuatan AI, memiliki beragam pilihan model yang tersedia diperlukan untuk:

  • Memacu inovasi: Beragam model mendorong inovasi dengan menawarkan kekuatan yang berbeda untuk menangani berbagai masalah, sekaligus membantu tim beradaptasi dengan kebutuhan bisnis dan ekspektasi pelanggan yang terus berkembang.
  • Sesuaikan untuk keunggulan kompetitif: Beragam model memungkinkan perusahaan menyesuaikan aplikasi AI untuk kebutuhan khusus, memberikan keunggulan kompetitif. Gen AI dapat diadaptasi untuk tugas tertentu, mulai dari aplikasi percakapan yang menjawab pertanyaan hingga menulis kode atau menghasilkan ringkasan cepat.
  • Mempercepat waktu ke pasar: Dalam lingkungan bisnis yang cepat, waktu menjadi faktor krusial. Portofolio model yang beragam dapat mempercepat proses pengembangan, memungkinkan perusahaan meluncurkan penawaran yang didukung AI dengan lebih cepat. Ini sangat penting dalam gen AI, di mana akses ke inovasi terbaru memberikan keunggulan kompetitif yang signifikan.
  • Tetap fleksibel menghadapi perubahan: Kondisi pasar dan strategi bisnis terus berkembang. Memiliki berbagai pilihan model memungkinkan bisnis beradaptasi cepat dan efektif. Akses ke beberapa opsi memudahkan penyesuaian ketika muncul tren baru atau perubahan strategi, menjaga kelincahan dan ketahanan.
  • Mengoptimalkan biaya di berbagai contoh penggunaan: setiap model memiliki implikasi biaya yang berbeda. Dengan mengakses beragam model, bisnis dapat memilih opsi paling efisien untuk tiap aplikasi. Beberapa tugas mungkin membutuhkan ketepatan dari model berbiaya tinggi, sementara lainnya dapat ditangani dengan alternatif yang lebih terjangkau tanpa mengorbankan kualitas. Misalnya, dalam layanan pelanggan, throughput dan latensi lebih penting daripada akurasi, sedangkan dalam sumber daya dan pengembangan, akurasi menjadi prioritas.
  • Mengurangi risiko: Mengandalkan satu model atau pilihan yang terbatas dapat berisiko. Portofolio model yang beragam membantu mengurangi konsentrasi risiko, memastikan bisnis tetap tangguh terhadap kekurangan atau kegagalan dari satu pendekatan tertentu. Strategi ini memungkinkan distribusi risiko dan menyediakan alternatif ketika tantangan muncul.
  • Mematuhi peraturan: Lingkungan regulasi AI terus berkembang dengan pertimbangan etis di garis depan. Setiap model dapat membawa implikasi berbeda terhadap keadilan, privasi, dan kepatuhan. Portofolio pilihan yang luas membantu bisnis menavigasi kompleksitas ini dan memilih model yang memenuhi standar hukum dan etika.

Memilih model AI yang tepat

Sekarang setelah kita memahami pentingnya pemilihan model, bagaimana kita mengatasi kelebihan pilihan saat memilih model yang tepat untuk contoh penggunaan tertentu? Masalah kompleks ini dapat dipecah menjadi serangkaian langkah sederhana yang dapat diterapkan hari ini:

  1. Identifikasi contoh penggunaan yang jelas: tentukan kebutuhan dan persyaratan spesifik aplikasi bisnis Anda. Ini termasuk menyusun prompt terperinci yang mempertimbangkan seluk-beluk industri dan bisnis agar model selaras dengan tujuan.
  2. Daftar semua opsi model: evaluasi berbagai model berdasarkan ukuran, akurasi, latensi, dan risiko terkait. Pahami kekuatan dan kelemahan tiap model, termasuk pertukaran antara akurasi, latensi, dan throughput.
  3. Evaluasi atribut model: Nilai kesesuaian ukuran model dengan kebutuhan Anda, termasuk bagaimana skala model memengaruhi kinerja dan risiko. Fokus langkah ini adalah memilih ukuran model yang optimal untuk contoh penggunaan, karena lebih besar tidak selalu lebih baik. Model yang lebih kecil pun dapat mengungguli model besar dalam domain dan contoh penggunaan tertentu.
  4. Uji opsi model: Lakukan pengujian untuk memastikan model bekerja sesuai harapan dalam kondisi yang meniru skenario dunia nyata. Gunakan tolok ukur akademik dan kumpulan data khusus domain untuk mengevaluasi kualitas output, lalu sesuaikan model, misalnya melalui rekayasa prompt atau penyetelan model untuk mengoptimalkan kinerja.
  5. Perbaiki pilihan Anda berdasarkan biaya dan kebutuhan penerapan: Setelah pengujian, sesuaikan pilihan dengan mempertimbangkan pengembalian investasi, efektivitas biaya, dan kepraktisan penerapan dalam sistem serta infrastruktur yang ada. Pertimbangkan juga manfaat lain seperti latensi lebih rendah atau transparansi lebih tinggi.
  6. Pilih model yang memberikan nilai terbesar: Tentukan model AI yang menawarkan keseimbangan optimal antara kinerja, biaya, dan risiko, disesuaikan dengan contoh penggunaan spesifik Anda.

Perpustakaan model IBM® watsonx

Dengan mengejar strategi multimodel, perpustakaan IBM® watsonx menawarkan model berpemilik, sumber terbuka, dan pihak ketiga, seperti yang ditunjukkan pada gambar:

Daftar model dasar watsonx per 8 Mei 2024. Daftar model dasar watsonx per 8 Mei 2024.

Ini memberi klien berbagai pilihan, memungkinkan mereka untuk memilih model yang paling sesuai dengan preferensi bisnis, regional, dan risiko unik mereka.

Selain itu, watsonx memungkinkan klien menerapkan model pada infrastruktur pilihan mereka dengan opsi hybrid, multicloud, atau on-premises, untuk menghindari vendor lock-in dan menurunkan total biaya kepemilikan.

IBM® Granite: Model dasar Kelas Enterprise dari IBM®

Karakteristik model dasar dapat dikelompokkan menjadi tiga atribut utama. Organisasi harus memahami bahwa menekankan satu atribut secara berlebihan dapat mengorbankan yang lain. Menyeimbangkan ketiganya adalah kunci untuk menyesuaikan model agar sesuai dengan kebutuhan spesifik organisasi:

  1. Tepercaya: Model yang jelas, dapat dijelaskan, dan tidak berbahaya.
  2. Performa: Tingkat kinerja yang tepat untuk domain bisnis yang ditargetkan dan contoh penggunaan.
  3. Hemat biaya: Model yang menawarkan gen AI dengan total biaya kepemilikan yang lebih rendah dan risiko yang lebih rendah.

IBM® Granite adalah seri unggulan model kelas enterprise yang dikembangkan oleh IBM® Research. Model-model ini menggabungkan kombinasi optimal dari atribut penting dengan fokus pada kepercayaan dan keandalan, memungkinkan bisnis menjalankan inisiatif gen AI mereka dengan sukses. Ingat, bisnis tidak dapat menskalakan gen AI menggunakan model dasar yang tidak dapat mereka percayai.

IBM® watsonx menyediakan model AI kelas enterprise yang dihasilkan melalui proses penyempurnaan yang ketat. Proses ini dimulai dari inovasi yang dipimpin IBM® Research, dengan kolaborasi terbuka dan pelatihan menggunakan konten relevan bagi perusahaan sesuai IBM® AI Ethics Code untuk mempromosikan transparansi data.

IBM® Research mengembangkan teknik penyetelan instruksi yang meningkatkan model sumber terbuka buatan IBM® dan model pilihan lainnya dengan kemampuan penting untuk penggunaan perusahaan. Di luar tolok ukur akademis, kumpulan data ‘FM_EVAL’ kami mensimulasikan aplikasi AI perusahaan di dunia nyata. Model terkuat dari pipeline ini tersedia di IBM® watsonx.ai, memberikan klien model dasar gen AI kelas enterprise yang andal, seperti ditunjukkan pada gambar:

Model dasar gen AI kelas Enterprise

Pengumuman model terbaru:

  • Model Granite: keluarga model yang dilatih dalam 116 bahasa pemrograman dengan ukuran 3 hingga 34 miliar parameter, tersedia sebagai model dasar maupun varian yang mengikuti instruksi.
  • Granite-7B-Lab: mendukung tugas tujuan umum dan disetel menggunakan metodologi penyelarasan chatbot skala besar IBM® (LAB) untuk memasukkan keterampilan dan pengetahuan baru.

Coba model dasar kelas enterprise kami di watsonx melalui demo obrolan watsonx.ai. Jelajahi kemampuannya dalam membuat ringkasan, menghasilkan konten, dan memproses dokumen melalui antarmuka obrolan yang sederhana dan intuitif.