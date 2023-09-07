Ini adalah waktu yang sensasional dalam AI untuk bisnis. Seiring dengan penerapan teknologi secara lebih luas di berbagai bidang, mulai dari layanan pelanggan, SDM, hingga modernisasi kode, kecerdasan buatan (AI) membantu semakin banyak dari kita untuk bekerja dengan lebih cerdas, bukan lebih keras. Dan karena kita baru saja memulai revolusi AI untuk bisnis, potensi untuk meningkatkan produktivitas dan kreativitas sangat besar.
Namun, AI yang ada saat ini adalah bidang yang sangat dinamis dan platform AI harus mencerminkan dinamika itu, menggabungkan kemajuan terbaru untuk memenuhi tuntutan hari ini dan esok. Inilah sebabnya mengapa kami di IBM terus menambahkan kemampuan baru yang tangguh ke IBM watsonx, portofolio produk AI kami.
Hari ini kami mengumumkan tambahan terbaru kami: keluarga baru model dasar buatan IBM yang akan tersedia di watsonx.ai, studio kami untuk AI generatif, model dasar, dan machine learning. Secara kolektif dinamai "Granite", model dasar dalam berbagai ukuran ini menerapkan AI generatif pada bahasa dan kode. Sama seperti batu granit, bahan serbaguna yang kuat dengan banyak kegunaan dalam konstruksi dan manufaktur, demikian juga kami di IBM meyakini bahwa model Granite ini akan memberikan nilai jangka panjang bagi bisnis Anda.
Namun sekarang mari kita lihat lebih jauh ke bagian yang tersembunyi dan kami akan menjelaskan sedikit tentang bagaimana kami membangunnya, dan bagaimana hal ini akan membantu Anda membawa AI ke tingkat berikutnya dalam bisnis Anda.
Dikembangkan oleh IBM Research, model Granite — Granite.13b.instruct dan Granite.13b.chat — menggunakan arsitektur “Decoder” yang mendasari kemampuan model bahasa besar saat ini untuk memprediksi kata berikutnya dalam urutan.
Pada 13 miliar model parameter, model Granite lebih efisien daripada model yang lebih besar, pas pada GPU V100-32GB tunggal. Model ini juga dapat memiliki dampak yang lebih kecil pada lingkungan sambil berkinerja baik pada tugas-tugas domain bisnis khusus seperti ringkasan, menjawab pertanyaan dan klasifikasi. Mereka dapat diterapkan secara luas di seluruh industri, dan mendukung tugas-tugas NLP lainnya seperti pembuatan konten, ekstraksi wawasan, dan generasi dengan dukungan pengambilan data (kerangka kerja untuk meningkatkan kualitas respons dengan menghubungkan model ke sumber pengetahuan eksternal) dan pengenalan entitas bernama (mengidentifikasi dan mengekstraksi informasi kunci dalam teks).
Di IBM kami berfokus pada pembuatan model yang ditargetkan untuk bisnis. Demikian pula dengan keluarga model Granite, jadi kami melatih mereka pada berbagai kumpulan data — total 7 TB sebelum prapemrosesan, 2,4 TB setelah prapemrosesan — untuk menghasilkan 1 triliun token, kumpulan karakter yang memiliki makna semantik untuk model. Pilihan kumpulan data kami ditargetkan untuk kebutuhan pengguna bisnis dan mencakup data dari domain berikut:
Dengan melatih model pada kumpulan data khusus perusahaan, kami membantu memastikan model kami dibiasakan dengan bahasa dan jargon khusus dari industri ini dan membuat keputusan berdasarkan pengetahuan industri yang relevan.
Dalam bisnis, kepercayaan adalah lisensi Anda untuk beroperasi. “Percayalah pada kami” bukanlah argumen, terutama ketika menyangkut AI. Sebagai salah satu perusahaan pertama yang mengembangkan AI perusahaan, pendekatan IBM terhadap pengembangan AI dipandu oleh prinsip-prinsip inti yang didasarkan pada komitmen kepercayaan dan transparansi. Produk IBM watsonx memungkinkan Anda untuk tidak hanya menjadi pengguna AI, namun juga pencipta nilai AI. Produk ini memiliki proses menyeluruh untuk membangun dan menguji model dasar dan AI generatif—dimulai dengan pengumpulan data dan berakhir dengan titik kontrol untuk melacak penerapan model dan aplikasi yang bertanggung jawab—yang berfokus pada tata kelola, penilaian risiko, mitigasi bias, dan kepatuhan.
Karena model Granite akan tersedia bagi klien untuk beradaptasi dengan aplikasi mereka sendiri, setiap kumpulan data yang digunakan dalam pelatihan menjalani proses peninjauan tata kelola, risiko, dan kepatuhan (GRC) yang ditentukan. Kami telah mengembangkan prosedur tata kelola untuk memasukkan data ke dalam Tumpukan Data IBM yang konsisten dengan prinsip-prinsip Etika AI IBM. Mengatasi kriteria GRC untuk data yang mencakup seluruh siklus hidup data pelatihan. Tujuan kami adalah untuk membuat tautan yang dapat diaudit dari model dasar terlatih hingga versi kumpulan data spesifik yang digunakan untuk melatih model.
Banyak perhatian media telah difokuskan (dengan benar) pada risiko AI generatif yang menghasilkan output kebencian atau memfitnah. Di IBM kami tahu bahwa bisnis tidak bisa mengambil risiko seperti itu, jadi model Granite kami dilatih pada data yang diteliti oleh “detektor HAP” kami sendiri, model bahasa yang dilatih oleh IBM untuk mendeteksi dan membasmi konten yang penuh kebencian dan umpatan tidak senonoh (sesuai dengan namanya “HAP” atau Hate speech, Abuse, and Profanity), yang dibandingkan dengan model internal maupun publik. Setelah skor ditetapkan untuk setiap kalimat dalam dokumen, analitik dijalankan pada kalimat dan skor untuk menjelajahi distribusi, yang menentukan persentase kalimat untuk pemfilteran.
Selain itu, kami menerapkan berbagai ukuran kualitas lainnya. Kami mencari dan menghapus duplikasi yang meningkatkan kualitas output dan menggunakan filter kualitas dokumen untuk lebih menghapus dokumen berkualitas rendah yang tidak cocok untuk pelatihan. Kami juga menerapkan perlindungan data secara teratur dan berkelanjutan, termasuk pemantauan untuk situs web yang dikenal karena pembajakan materi atau memposting materi ofensif lainnya, dan menghindari situs web tersebut.
Dan karena lingkungan teknologi AI generatif terus berubah, proses menyeluruh kami akan terus berkembang dan meningkat, memberikan hasil yang dapat mereka percayai.
Kunci dari visi IBM tentang AI untuk bisnis adalah gagasan pemberdayaan. Setiap organisasi akan menerapkan model Granite untuk memenuhi tujuannya sendiri, dan setiap perusahaan memiliki peraturan sendiri yang harus dipatuhi, baik yang berasal dari hukum, norma sosial, standar industri, tuntutan pasar, atau persyaratan arsitektur. Kami percaya bahwa perusahaan harus diberdayakan untuk mempersonalisasi model mereka sesuai dengan nilai-nilai mereka sendiri (dalam batas-batas tertentu), di mana pun beban kerja mereka berada, dengan menggunakan alat watsonx.
Tapi itu belum semuanya. Apa pun yang Anda lakukan di watsonx, Anda mempertahankan kepemilikan atas data. Kami tidak menggunakan data Anda untuk melatih model kami; Anda tetap memegang kendali atas model yang Anda buat dan Anda dapat membawanya ke mana saja.
Model Granite awal hanyalah permulaan: lebih banyak direncanakan dalam bahasa lain dan model terlatih IBM® lebih lanjut juga sedang dalam persiapan. Sementara itu kami Lanjutkan menambahkan model sumber terbuka ke watsonx. Kami baru-baru ini mengumumkan bahwa IBM® kini menawarkan model Llama 2-chat 70 miliar parameter Meta kepada beberapa klien untuk akses awal dan berencana untuk menyediakannya secara luas di bulan September. Selain itu, IBM® akan meng-host StarCoder, model bahasa besar untuk kode, termasuk lebih dari 80+ bahasa pemrograman, komit Git, masalah GitHub, dan Jupyter Notebook.
Selain berbagai model baru, IBM juga meluncurkan kemampuan pelengkap baru di studio watsonx.ai. Yang hadir akhir bulan ini adalah iterasi pertama dari Tuning Studio kami, yang akan mencakup penyetelan prompt, sebuah cara yang efisien dan murah bagi klien untuk menyesuaikan model dasar dengan tugas hilir unik mereka melalui pelatihan model pada data tepercaya mereka sendiri. Kami juga akan meluncurkan Pembuat Data Sintetis yang akan membantu pengguna dalam membuat kumpulan data tabular buatan dari skema data khusus atau kumpulan data internal. Fitur ini akan memungkinkan pengguna untuk mengekstraksi insight untuk pelatihan model AI dan penyempurnaan atau simulasi skenario dengan penurunan risiko, meningkatkan pengambilan keputusan, dan mempercepat waktu penyiapan produk.
Penambahan model dasar Granite dan kemampuan lainnya ke dalam watsonx membuka berbagai kemungkinan baru yang menarik dalam AI untuk bisnis. Berbagai ide dan solusi baru menyertai kehadiran model dan alat baru. Dan bagian terbaik dari itu semua? Ini hanyalah permulaan.
Pernyataan mengenai arah dan maksud masa depan IBM® dapat berubah atau ditarik tanpa pemberitahuan dan hanya mewakili tujuan dan sasaran.