AI agen memiliki masalah data tidak terstruktur: IBM meluncurkan solusi

6 Mei 2025

Penulis

Edward Calvesbert

Vice President

Product Management, watsonx Platform

Di Think minggu ini, IBM menyederhanakan tumpukan data untuk AI secara drastis.

IBM sedang mempratinjau perkembangan besar dari watsonx.data, yang dapat membantu organisasi membuat data mereka siap untuk AI dan menyediakan fondasi data hybrid yang terbuka serta manajemen data terstruktur dan tidak terstruktur yang siap untuk perusahaan.

Hasilnya? AI yang empat puluh persen lebih akurat daripada RAG konvensional, menurut pengujian dengan IBM watsonx.data.1 Produk dan fitur yang diperkirakan akan dirilis pada bulan Juni meliputi:

  • Integrasi watsonx.data, perangkat lunak untuk mengatur akses data dan rekayasa di berbagai gaya dan format integrasi dalam satu antarmuka, dengan berfokus pada fleksibilitas dan skala
  • watsonx.data intelligence, perangkat lunak untuk mengubah cara organisasi mengurasi, mengelola, dan memanfaatkan data yang bermakna, memanfaatkan kekuatan AI untuk menyederhanakan tata kelola data
  • Penambahan watsonx sebagai penyedia API dalam Llama Stack Meta yang meningkatkan kemampuan perusahaan untuk menerapkan AI generatif dalam skala besar dan mengutamakan keterbukaan

watsonx.data integration dan watsonx.data intelligence akan tersedia sebagai produk mandiri dan kemampuan tertentu juga akan tersedia melalui watsonx.data—memaksimalkan pilihan klien dan modularitas.

Untuk melengkapi semua produk ini, IBM baru-baru ini mengumumkan niatnya untuk mengakuisisi DataStax, yang unggul dalam memanfaatkan data tidak terstruktur untuk AI generatif. Dengan DataStax, klien dapat mengakses kemampuan pencarian vektor tambahan.

Berdasarkan pengujian internal yang membandingkan kebenaran jawaban output model AI menggunakan lapisan pengambilan watsonx.data Premium Edition dengan RAG hanya vektor pada tiga contoh penggunaan dengan kumpulan data IBM, menggunakan kumpulan yang sama dari komoditas sumber terbuka yang dipilih, untuk melakukan inferensi, penilaian, dan penanaman model serta variabel tambahan . Hasil dapat bervariasi.

Konteks untuk evolusi besar ini

Perusahaan menghadapi hambatan utama pada AI generatif yang akurat dan berkinerja— terutama AI agen. Tetapi penghalang bukanlah apa yang dipikirkan sebagian besar pemimpin bisnis.

Masalahnya bukanlah biaya inferensi atau model "sempurna" yang sulit dipahami. Masalahnya adalah data.

Organisasi membutuhkan data tepercaya dan khusus perusahaan agar AI agen benar-benar menciptakan nilai—data tidak terstruktur di dalam email, dokumen, presentasi, dan video. Diperkirakan bahwa 90% data yang dihasilkan oleh perusahaan tidak terstruktur pada tahun 2022, tetapi hanya 1% proyek IBM yang diperhitungkan dalam LLM.

Data tidak terstruktur bisa sangat sulit untuk dimanfaatkan. Data ini sangat terdistribusi dan dinamis, terkunci di dalam format yang beragam, tidak memiliki label yang rapi, dan sering kali membutuhkan konteks tambahan untuk menafsirkannya secara penuh. Generasi dengan Dukungan Pengambilan Data (RAG) konvensional tidak efektif dalam mengekstraksi nilainya dan tidak dapat menggabungkan dengan baik data yang tidak terstruktur dan terstruktur.

Sementara itu, berbagai alat yang terputus dapat membuat tumpukan data untuk AI menjadi rumit dan menyulitkan. Perusahaan menyulap gudang data, data lake, dan tata kelola data serta alat integrasi data. Tumpukan data dapat terasa membingungkan seperti data tidak terstruktur yang harus dikelolanya.

Banyak organisasi tidak mengatasi akar masalah. Mereka hanya berfokus pada lapisan aplikasi AI generatif, bukan lapisan data penting di bawahnya. Hingga organisasi memperbaiki fondasi data mereka, agen AI, dan inisiatif AI generatif lainnya tidak akan mencapai potensi penuhnya.

Membantu organisasi membuat data mereka siap AI

Kemampuan baru IBM akan memungkinkan organisasi untuk menyerap, mengatur, dan mengambil data tidak terstruktur (dan terstruktur)—dan dari sana, menskalakan AI generatif yang akurat dan berkinerja tinggi.

Mendaftar untuk mendapatkan pembaruan

Berita produk terbaru dari IBM

Dapatkan pengumuman produk dan fitur terbesar, termasuk obrolan video terbaru tentang produk dan penawaran paket pendidikan dari IBM dan mitra pelatihan kami. Lihat Pernyataan Privasi IBM.

Terima kasih! Anda telah berlangganan.