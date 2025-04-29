Berkat ChatGPT dan puluhan chatbot lain yang dibangun di atas model dasar, hampir semua orang tahu tentang model bahasa besar (LLM). Tetapi bagaimana dengan model basis data besar (LDM)?
“LDM adalah model yang disetel untuk memperoleh insight dari kumpulan data besar dan aliran transaksi daripada bahasa dan teks manusia, yang merupakan domain LLM dan chatbot,” kata Ric Lewis, SVP Infrastruktur IBM®, pada IBM® 2025 Investor Day.
Sementara LLM dilatih tentang data yang tersedia untuk umum seperti buku, artikel, Wikipedia, dan berbagai sumber lainnya, materi pelatihan mereka biasanya tidak mencakup sejumlah besar data dalam perusahaan. Faktanya, hanya 1% data perusahaan yang saat ini digunakan dalam model bahasa yang besar.
LDM, sebaliknya, dilatih tentang catatan transaksi, informasi produk, data hubungan klien, log pelatihan dan catatan karyawan, di antara sumber data perusahaan lainnya. Akibatnya, perusahaan dapat menggunakan LDM untuk mengungkap makna dalam 99% data yang belum dimanfaatkan yang ditemukan di basis data mereka menggunakan pertanyaan percakapan, dalam proses yang dikenal sebagai pencarian semantik. Pencarian semantik melampaui kata kunci yang cocok untuk memahami makna dan konteks di balik permintaan pencarian pengguna.
“LDMs mewakili cara baru yang menarik untuk memanfaatkan data yang tertanam dalam aplikasi bisnis dan aliran transaksi untuk mengekstrak insight baru dan nilai baru bagi perusahaan,” kata Lewis dalam sebuah wawancara dengan IBM® Think. “Sementara LDM baru saja muncul, kami optimis tentang potensi mereka untuk digunakan untuk menginformasikan aplikasi agen dan membantu bisnis mendorong hasil yang lebih baik,” jelasnya, menambahkan bahwa model-model ini sudah diadopsi untuk menanamkan AI ke dalam proses transaksional.
Pertimbangkan, misalnya, bisnis retail yang ingin mengidentifikasi pelanggan yang daya belanjanya rata-rata dan riwayat pembelian mencerminkan pembelanja bernama Claire, yang baru-baru ini datang ke toko dan menyatakan minat yang kuat pada produk kecantikan baru. Secara tradisional, ilmuwan data peretail akan mulai dengan mendefinisikan pipeline—proses untuk mengubah data mentah menjadi jawaban yang berguna untuk pertanyaan bisnis tertentu yang sedang dipertimbangkan. Selanjutnya, mereka akan merumuskan permintaan basis data dengan istilah yang sangat spesifik, seperti “Temukan semua pelanggan antara usia 20 dan 40 yang tinggal di New York dan yang telah menghabiskan setidaknya 1.000 USD untuk produk kecantikan tahun lalu.”
Ilmuwan data kemudian akan mengekstrak data yang diperlukan, memuatnya ke platform lain, dan selama beberapa minggu atau bulan, menentukan pelanggan mana yang menyerupai Claire dalam basis data mereka.
Dengan melihat proses yang ekstensif yang terlibat dalam menyelesaikan kueri basis data tradisional, “ada banyak data yang ada di mainframe perusahaan yang tidak biasanya menjadi target AI generatif dan perusahaan tidak mendapatkan insight apa pun darinya,” Catherine Wu, Direktur Program untuk Db2 di Laboratorium Lembah Silikon IBM®, mengatakan kepada IBM® Think.
Sebagian dari ini bermuara pada masalah biaya dan keamanan yang terkait dengan memindahkan data ke lingkungan eksternal. “Kami memiliki pelanggan yang memberi tahu kami bahwa hanya memindahkan data adalah 30-40% dari biaya TI mereka,” kata Wu. “Juga, begitu data pindah dari mainframe mereka, mereka tidak dapat melacak ke mana perginya, jadi itu menjadi perhatian besar bagi pelanggan.”
LDM, sebaliknya, memungkinkan pengguna untuk mencari basis data dan mendapatkan jawaban jauh lebih cepat dan mudah, apakah basis data itu on premises, di cloud atau hybrid dari keduanya. Jadi peretail dalam contoh di atas dapat dengan mudah menanyakan basis data untuk bertanya, “Daftar 100 klien teratas seperti Claire.” Dan beberapa saat kemudian, siapa pun dengan pelatihan SQL dasar dapat menarik informasi itu tanpa harus pindah data ke mana pun, kata Wu. IBM® meluncurkan produk basis data pertamanya menggunakan model basis data besar pada tahun 2022 yang disebut SQL Data Insights (SQL DI), yang merupakan bagian dari basis data Db2 untuk z/OS yang terletak di IBM® Z mainframes, yang menguasai lebih dari 70% transaksi keuangan dunia berdasarkan nilai.
Seperti yang dikatakan Kate Soule, Direktur Manajemen Produk Teknis untuk Granite, pada episode terbaru podcast Mixture of Experts, LLM bisa “sering berlebihan.”
“Persyaratan pelatihan dan penyetelan LDM dapat dicapai dengan infrastruktur yang berbeda dari LLM,” kata Lewis dari IBM®. “Anda tidak perlu pertanian GPU besar-besaran untuk mengejar masalah yang sebagian besar bisnis coba selesaikan. Dibandingkan dengan semua data yang mungkin digunakan untuk melatih LLM, basis data transaksi perusahaan relatif kecil. Namun, kata Lewis, data khusus perusahaan dapat membuat “model spesifik untuk memberikan hasil tertentu yang lebih efisien biaya dan seringkali lebih efektif.”
Dengan SQL DI IBM®, setiap nilai dalam kolom basis data, terlepas dari jenis datanya, diterjemahkan ke dalam token teks. “Akibatnya, model menganggap setiap catatan basis data sebagai bag of words yang tidak teratur dalam kalimat seperti bahasa Inggris di mana setiap token mempertahankan hubungan yang sama dengan yang lain, terlepas dari posisinya dalam catatan,” kata IBM® Distinguished Engineer Akiko Hoshikawa. Selanjutnya, SQL DI menyimpulkan nilai basis data yang signifikan berdasarkan nilai kolom di sekitarnya, baik di dalam maupun di seluruh baris tabel. Dengan model yang dilatih dengan cara ini, hampir semua orang dapat menjalankan AI query pada data relasional untuk deteksi dan mencocokkan data yang serupa secara semantik langsung di dalam basis data.
Sementara banyak perusahaan menjelajahi LDM sebagai bukti konsep, beberapa perusahaan di asuransi dan retail sudah menggunakan alat ini untuk mempercepat proses ekstraksi nilai dari basis data mereka.
Thomas Baumann, seorang Penginjil Data di Swiss Mobiliar, perusahaan asuransi tertua di Swiss, menggunakan SQL DI IBM® di beberapa area perusahaan. Baumann mulai menggunakan SQL DI untuk membantu perusahaan menyesuaikan penawaran asuransi mobil dengan lebih baik untuk meningkatkan penjualan. Ketika seorang penjual berinteraksi dengan calon pemegang polis asuransi baru, mereka dapat memasukkan penawaran, dan LDM akan mengekstrak kasus sebelumnya yang paling mirip untuk menentukan kemungkinan pelanggan menerimanya.
“Kemudian, pengguna dapat mengubah beberapa parameter, seperti mengurangi deductible atau menawarkan diskon yang lebih agresif, dan kemudian mereka menghitung ulang peluang baru untuk kemungkinan sukses,” kata Baumann dalam sebuah wawancara dengan IBM® Think. “Kutipan yang diberikan jauh lebih canggih dan disesuaikan dengan masing-masing pelanggan dibandingkan sebelumnya.”
Saat menggunakan SQL DI IBM® untuk produk asuransi mobil Swiss Mobiliar, perusahaan melatih model dengan sekitar 15 juta catatan data penawaran asuransi mobil, dengan setiap catatan berisi beberapa lusin atribut untuk setiap catatan, seperti demografi, data kendaraan, dan harga. Baumann mengatakan bahwa tenaga penjualan menemukan bahwa mereka dapat membuat kutipan yang lebih ilmiah dengan memeriksa peluang berbagai kutipan kandidat sebelum memilih satu.
Akibatnya, mereka meningkatkan tingkat penutupan penjualan asuransi sebesar 7% selama enam bulan—peningkatan yang menurut Baumann akan memakan waktu sekitar dua tahun tanpa menggunakan LDM. Berdasarkan keberhasilan uji coba ini, Swiss Mobiliar sekarang menggunakan LDM untuk semua produk asuransinya (kecuali asuransi jiwa), mulai dari asuransi bangunan hingga asuransi rumah tangga.
“Dua manfaat utama SQL DI adalah bahwa Anda dapat dengan cepat pindah dari ide ke pra-produksi,” kata Baumann. “Anda juga tidak perlu memindahkan data dari satu platform ke platform lainnya.”
Selain asuransi, tim SQL DI IBM® juga bekerja dengan beberapa pengecer makanan di AS dan Eropa yang tertarik menggunakan LDM untuk memberi pelanggan pengalaman berbelanja yang lebih disesuaikan. Sebagai contoh, pelanggan dapat membandingkan suatu jenis sereal yang sedang dipegangnya dengan melakukan kueri semantik untuk menemukan alternatif yang memiliki rasa serupa namun dengan nilai gizi yang lebih baik. LDM yang digunakan untuk membuat saran seperti “rekomendasi Amazon atau Netflix yang lebih canggih dan dipersonalisasi,” kata Hoshikawa.
Di luar aplikasi yang menghadap pelanggan, perusahaan sudah menerapkan LDM di banyak area B2B, seperti deteksi anomali dan deteksi penipuan real-time. Setiap perusahaan yang mengeluarkan kontrak, misalnya, dapat menggunakan LDM untuk dengan cepat mengidentifikasi kontrak yang tidak biasa, kata Hoshikawa dari IBM®.
Sementara itu, LDM juga dapat mendukung deteksi penipuan real-time yang lebih canggih. Selain mengidentifikasi transaksi yang tidak mengikuti pola khas, LDM dapat menanyakan basis data untuk mengidentifikasi catatan yang mencakup berbagai atribut yang terkait dengan perilaku mencurigakan, seperti perusahaan yang kehilangan laporan Better Business Bureau atau kekurangan alamat fisik.
Lewis percaya bahwa LLM dan LDM akan diikuti oleh banyak model khusus lainnya. “Kami percaya LDM, sama seperti LLM, adalah alat yang berharga untuk memungkinkan gelombang aplikasi agen dan membantu mendorong hasil yang lebih baik,” katanya. “Tapi kami tidak berharap mereka selalu digunakan secara terpisah. Faktanya, kami percaya skenario yang ideal adalah memasukkan LDM ke dalam model data perusahaan dan menggabungkannya dengan LLM dan model lain yang sesuai untuk tujuan untuk mendorong nilai baru dalam skala besar untuk perusahaan dan masyarakat.”
Demikian pula, Lewis tidak mengharapkan satu perusahaan atau organisasi untuk selalu mendominasi. “Jangan berasumsi itu akan menjadi satu perusahaan, atau perusahaan yang memiliki server terbanyak dan GPU terbanyak, yang akan mengembangkan model Swiss Army Knife,” kata Lewis. "Saya tidak percaya itu. “Sama seperti saya percaya bahwa kita bisa mendapatkan insight paling berharga dengan memanfaatkan pengetahuan khusus dari para ahli di berbagai bidang, saya juga meyakini bahwa kemampuan untuk menggabungkan LLM, LDM, dan gelombang berikutnya dari model yang dibuat untuk tujuan tertentu akan menghasilkan insight yang benar-benar baru serta hasil yang benar-benar teroptimalkan.”
Sederhanakan akses data dan otomatiskan tata kelola data. Temukan kekuatan mengintegrasikan strategi data lakehouse ke dalam arsitektur data Anda, termasuk mengoptimalkan biaya beban kerja Anda dan menskalakan AI dan analitik dengan semua data Anda, di mana saja.
Jelajahi panduan pemimpin data untuk membangun organisasi berbasis data dan mendorong keunggulan bisnis.
Baca panduan kami untuk mempelajari cara menggunakan database yang tepat untuk aplikasi, analitik, dan AI generatif.
Pelajari bagaimana pendekatan data lakehouse terbuka dapat memberikan data yang dapat dipercaya dan analitik serta eksekusi proyek AI yang lebih cepat.
Dapatkan insight unik tentang lingkungan solusi ABI yang terus berkembang, dengan menyoroti temuan utama, asumsi, dan rekomendasi bagi para pemimpin data dan analitik.
Gunakan solusi database IBM untuk memenuhi berbagai kebutuhan beban kerja di hybrid cloud.
Jelajahi IBM Db2, database relasional yang menghadirkan kinerja tinggi, skalabilitas, dan keandalan untuk menyimpan dan mengelola data terstruktur. Database ini tersedia sebagai SaaS di IBM Cloud atau untuk hosting mandiri.
Buka nilai data perusahaan dengan IBM Consulting, membangun organisasi berbasis insight yang memberikan keuntungan bisnis.
Gunakan solusi database IBM untuk memenuhi berbagai kebutuhan beban kerja di hybrid cloud.