Bagaimana model dasar dan penyimpanan data membuka potensi bisnis AI generatif

Pemandangan udara yang menampilkan sabuk konveyor dan banyak kotak di gudang cerdas

Penulis

IBM Data and AI Team

Sesuai dengan namanya, model AI generatif menghasilkan teks, gambar, kode, atau respons lain berdasarkan prompt pengguna. Organisasi yang menggunakannya dengan benar dapat meraih banyak manfaat, mulai dari peningkatan efisiensi operasional dan pengambilan keputusan yang lebih baik hingga pembuatan konten pemasaran yang cepat. Namun, hal apa yang mewujudkan fungsionalitas generatif dari model-model ini beserta manfaatnya bagi organisasi?

Di sinilah model dasar berperan. Model ini adalah mesin dasar yang memberikan kemampuan penalaran dan deep learning yang ditingkatkan bagi model generatif, dan kemampuan ini tidak dimiliki model machine learning tradisional. Bersama dengan penyimpanan data, model dasar memungkinkan pembuatan dan penyesuaian alat AI generatif untuk organisasi di berbagai industri yang ingin mengoptimalkan layanan pelanggan, pemasaran, SDM (termasuk akuisisi talenta), dan fungsi TI.

Model dasar: Kekuatan pendorong di balik AI generatif

Dikenal juga sebagai transformator, model dasar adalah algoritma AI yang dilatih menggunakan sejumlah besar data yang luas. Istilah “foundation model” atau model dasar dicetuskan oleh Stanford Institute for Human-Centered Artificial Intelligence pada tahun 2021.

Model dasar dibangun pada arsitektur model jaringan neural untuk memproses informasi seperti yang dilakukan otak manusia. Model dasar dapat dilatih untuk melakukan tugas-tugas seperti klasifikasi data, identifikasi objek dalam gambar (visi komputer) dan pemrosesan bahasa alami (NLP) (memahami dan menghasilkan teks) dengan tingkat akurasi yang tinggi. Model ini juga dapat melakukan pembelajaran dengan pengawasan sendiri untuk menggeneralisasi dan menerapkan pengetahuannya pada tugas-tugas baru.

Alih-alih mencurahkan waktu dan tenaga untuk melatih model dari awal, ilmuwan data dapat menggunakan model dasar terlatih sebagai titik awal untuk membuat atau menyesuaikan model AI untuk contoh penggunaan tertentu. Sebagai contoh, model dasar dapat digunakan sebagai dasar untuk model AI generatif yang kemudian disesuaikan dengan kumpulan data manufaktur tambahan untuk membantu menemukan cara yang lebih aman dan lebih cepat untuk memproduksi suatu jenis produk.

Jenis model dasar tertentu yang dikenal sebagai model bahasa besar (LLM) dilatih menggunakan sejumlah besar data teks untuk tugas-tugas NLP. BERT (Bi-directional Encoder Representations from Transformers) adalah salah satu model dasar LLM yang paling awal dikembangkan. BERT adalah model sumber terbuka yang diciptakan oleh Google pada tahun 2018. Sistem ini dilatih menggunakan korpus data bahasa Inggris yang besar dengan pengawasan mandiri dan dapat digunakan untuk berbagai tugas, antara lain:

  • Menganalisis sentimen pelanggan/audiens
  • Menjawab pertanyaan seputar layanan pelanggan
  • Memprediksi teks dari data input
  • Menghasilkan teks berdasarkan prompt pengguna
  • Meringkas dokumen besar dan kompleks

Model dasar versus model machine learning tradisional

Model dasar yang digunakan untuk AI generatif berbeda dengan model machine learning tradisional karena dapat dilatih menggunakan sejumlah besar data tanpa label untuk mendukung aplikasi yang menghasilkan konten atau melakukan tugas.

Sementara itu, model machine learning tradisional biasanya dilatih untuk melakukan satu tugas menggunakan data berlabel, misalnya menggunakan gambar mobil berlabel untuk melatih model agar dapat mengenali mobil dalam gambar yang tidak berlabel.

Model dasar berfokus pada nilai perusahaan

Studio watsonx.ai adalah rangkaian model dasar bahasa dan kode dari IBM, yang masing-masing memiliki nama kode bertema geologi, dan dapat disesuaikan untuk beragam tugas perusahaan. Semua model watsonx.ai dilatih menggunakan data lake yang dikurasi oleh IBM dan berfokus pada perusahaan.

Kini tersedia: Slate

Slate adalah rangkaian model khusus encoder. Meskipun tidak bersifat generatif, model ini cepat dan efektif untuk banyak tugas NLP perusahaan.

Segera hadir: Granite

Model Granite didasarkan pada arsitektur mirip GPT dan khusus dekoder, serta ditujukan untuk tugas-tugas generatif.

Segera hadir: Sandstone

Model Sandstone menggunakan arsitektur encoder-decoder dan sangat cocok untuk menyempurnakan tugas-tugas tertentu.

Segera hadir: Obsidian

Model Obsidian menggunakan arsitektur modular baru yang dikembangkan oleh IBM Research, untuk menghadirkan efisiensi inferensi dan tingkat kinerja yang tinggi di berbagai tugas.

Menghubungkan model dasar dengan penyimpanan data untuk keberhasilan AI generatif

Tanpa akses aman ke pengetahuan tepercaya dan spesifik domain, model dasar tidak akan dapat diandalkan dan dimanfaatkan untuk aplikasi AI perusahaan. Kabar baiknya, penyimpanan data berfungsi sebagai repositori data yang aman dan memungkinkan penskalaan model dasar baik dari segi ukuran maupun data pelatihannya.

Penyimpanan data yang cocok untuk AI generatif yang berfokus pada bisnis dibangun pada arsitektur lakehouse terbuka yang menggabungkan kualitas data lake dan gudang data. Arsitektur ini hemat berkat penyimpanan objek berbiaya rendah dan dapat digunakan untuk berbagi data bervolume besar melalui format tabel terbuka seperti Apache Iceberg, yang dibangun untuk analisis berkinerja tinggi dan pemrosesan data berskala besar.

Model dasar dapat meminta data khusus domain bervolume sangat besar dalam kontainer yang hemat biaya dan dapat diskalakan. Karena kombinasi antara jenis penyimpanan data ini dan cloud memungkinkan skalabilitas yang hampir tanpa batas, celah pengetahuan model dasar dapat dipersempit atau bahkan dihilangkan seiring waktu dengan penambahan lebih banyak data. Makin banyak celah yang ditutup, model dasar makin dapat diandalkan dan makin besar pula ruang lingkupnya.

Penyimpanan data menyediakan repositori bagi ilmuwan data, yang dapat digunakan untuk mengumpulkan dan membersihkan data yang digunakan untuk melatih dan menyempurnakan model dasar. Penyimpanan data yang memanfaatkan infrastruktur cloud dan hybrid cloud penyedia pihak ketiga untuk memproses sejumlah besar data sangatlah penting menghemat biaya AI generatif.

Manfaat bisnis dari model dasar dan penyimpanan data

Ketika model dasar mengakses informasi di berbagai penyimpanan data dan cara penggunaan informasi tersebut disempurnakan demi melakukan berbagai tugas dan menghasilkan respons, alat AI generatif yang dihasilkan dapat membantu organisasi memperoleh manfaat berikut:

Peningkatan efisiensi dan produktivitas

Ilmu data

Ilmuwan data dapat menggunakan model terlatih untuk menerapkan alat AI secara efisien di berbagai situasi penting.

Dev

Pengembang dapat menulis, menguji, dan mendokumentasikan lebih cepat menggunakan alat AI yang menghasilkan cuplikan kode khusus.

Komunikasi internal

Eksekutif dapat menerima ringkasan buatan AI untuk laporan panjang, sementara karyawan baru akan menerima versi ringkas dari materi orientasi dan kumpulan data lainnya.

Operasi

Organisasi dapat menggunakan alat AI generatif untuk otomatisasi berbagai tugas, termasuk:

  • Mengklasifikasikan dan mengategorikan data
  • Berkomunikasi dengan pelanggan
  • Merutekan pesan ke departemen yang sesuai dengan waktu respons yang lebih cepat
  • Menghasilkan laporan
  • Menjadwalkan rapat dan janji temu

Pembuatan konten yang lebih cepat

Tim pemasaran dapat menggunakan alat AI generatif untuk membantu membuat konten tentang berbagai topik. Tim ini juga dapat dengan cepat dan akurat menerjemahkan kumpulan data pemasaran ke dalam berbagai bahasa.

Analisis yang lebih akurat

Pemimpin bisnis dan pemangku kepentingan lainnya dapat melakukan analisis dengan bantuan AI untuk menafsirkan sejumlah besar data tidak terstruktur, sehingga mereka memiliki pemahaman yang lebih baik tentang pasar, sentimen reputasi, dll.

IBM, model dasar, dan penyimpanan data

Untuk membantu organisasi melipatgandakan dampak AI di seluruh bisnis Anda, IBM menawarkan watsonx, portofolio produk AI kami. Portofolio ini terdiri dari tiga produk canggih:

  • Studio watsonx.ai untuk model dasar baru, AI generatif, dan machine learning
  • Penyimpanan data watsonx.data yang sesuai dengan tujuan dan dibangun pada arsitektur lakehouse terbuka
  • Toolkit watsonx.governance digunakan untuk mempercepat alur kerja AI yang dibangun dengan tanggung jawab, transparansi, dan keterjelasan.
 
Solusi terkait
IBM watsonx.ai

Latih, validasi, lakukan tuning, dan terapkan AI generatif, model dasar, dan kemampuan machine learning dengan IBM watsonx.ai, studio perusahaan generasi berikutnya untuk pembangun AI. Bangun aplikasi AI dalam waktu singkat, dengan sedikit data.

Temukan watsonx.ai
Solusi kecerdasan buatan (AI)

Gunakan AI di bisnis Anda dalam perpaduan antara keahlian AI terdepan di industri dari IBM dan portofolio solusi Anda.

Jelajahi solusi AI
Layanan AI

Temukan kembali alur kerja dan operasi yang penting dengan menambahkan AI untuk memaksimalkan pengalaman, pengambilan keputusan secara real-time, dan nilai bisnis.

Jelajahi layanan AI
Ambil langkah selanjutnya

Dapatkan akses satu atap ke kemampuan yang mencakup siklus hidup pengembangan AI. Hasilkan solusi AI yang kuat dengan antarmuka ramah pengguna, alur kerja yang efisien, serta akses ke API dan SDK berstandar industri.

Jelajahi watsonx.ai Pesan demo langsung