IBM watsonx.data: Meningkatkan akurasi AI dengan data tidak terstruktur dan terstruktur yang siap AI

Render digital untuk mewakili paket watsonx.ai untuk perusahaan

Penulis

Edward Calvesbert

Vice President, Product Management - watsonx.data

IBM

Hari ini, IBM meluncurkan evolusi IBM watsonx.data, satu-satunya data lakehouse hybrid untuk enterprise AI dan analitik, agar tersedia secara publik.

Organisasi sekarang dapat menyederhanakan dan menskalakan akses, persiapan, dan pengiriman data yang tidak terstruktur dan terstruktur untuk mendukung aplikasi gen AI yang lebih akurat dan relevan, meningkatkan skala layanan mandiri analitik dan menyederhanakan serta menskalakan akses, pengayaan, dan tata kelola data yang sebelumnya kompleks.

AI lebih akurat daripada RAG konvensional

Data Enterprise adalah alat terbaik untuk mendukung AI yang akurat dan berbeda yang relevan dengan industri dan klien Anda dan mendorong keunggulan kompetitif. Namun, 90% data perusahaan adalah data tidak terstruktur, yang sebagian besar tetap tidak dapat diakses dan kurang dimanfaatkan untuk gen AI.2

Sekarang Anda dapat mengakses, menyiapkan, dan mengirimkan data perusahaan yang tidak terstruktur untuk mendukung AI 40% lebih akurat daripada RAG konvensional dengan IBM watsonx.data*. Watsonx.data secara unik:

  1. Hybrid dan terbuka untuk mengakses data di mana pun lokasinya dan menerapkannya secara on premises, cloud, dan multi-cloud dengan interoperabilitas dengan ekosistem dan investasi data Anda yang ada.
  2. Mengoptimalkan beban kerja dengan beberapa mesin kueri yang disesuaikan untuk tujuan tertentu termasuk Apache Gluten sumber terbuka baru yang didukung Spark untuk mengoptimalkan biaya dan kinerja.
  3. Siap untuk Gen AI dengan kemampuan data fabric—watsonx.data integration dan watsonx.data intelligence—semuanya dalam data lakehouse untuk menghindari pembuatan silo data lainnya.

Sekarang Anda dapat menskalakan dan mengotomatiskan:

  1. Pengambilan data tidak terstruktur dan terstruktur Anda dari berbagai sistem sumber baru termasuk Filenet, Box, Google Docs, dan banyak lagi.
  2. Pengayaan semantik data Anda, membuat penyematan vektor dan turunan terstruktur dari entitas yang diekstraksi dan dinormalisasi dalam dokumen Anda untuk mendukung aplikasi AI yang memahami konteks posisi, hubungan, dan perhitungan untuk output yang lebih akurat dan lengkap.
  3. Tata kelola data Anda dengan kontrol akses yang diwarisi dari sistem sumber dokumen hingga pengambilan data Anda untuk AI, dengan anotasi PII untuk menghindari munculnya informasi sensitif.
  4. Pengambilan data tersebut di seluruh spektrum beban kerja yang luas dari BI hingga aplikasi dan agen gen AI

Semua ini dapat dilakukan dalam IBM watsonx.data untuk membuka data perusahaan yang tidak terstruktur untuk AI dan analitik tradisional, seperti rekayasa data, BI, dan ML.

Kecepatan dan skalabilitas untuk beban kerja analitik yang kompleks

IBM watsonx.data sekarang menawarkan Spark yang dipercepat Apache Gluten sebagai salah satu dari beberapa mesin kueri yang cocok untuk tujuan, secara signifikan meningkatkan kinerja untuk beban kerja Spark SQL yang butuh daya komputasi besar. Apache Gluten, perpustakaan berperforma tinggi, mengoptimalkan beban kerja Apache Spark SQL dengan menurunkan eksekusi ke Velox, mesin eksekusi C++ asli. Integrasi ini memberikan pemrosesan kueri yang lebih cepat dan efisiensi sumber daya yang ditingkatkan untuk analisis data skala besar. Kini organisasi dapat menjalankan tugas analitik yang kompleks dengan kecepatan dan skalabilitas yang lebih tinggi serta biaya yang lebih rendah.

Database NoSQL DataStax baru menambahkan kemampuan operasional dan vektor 

IBM baru-baru ini mengakuisisi DataStax, membawa datastore vektor operasional NoSQL, yang dibangun di atas Apache Cassandra, ke watsonx.data. Tambahan untuk watsonx.data ini meningkatkan kemampuan vektor kami dan memperkuat kemampuan generasi dengan dukungan pengambilan data dan kemampuan penanaman pengetahuan yang lebih tinggi.

DataStax dioptimalkan untuk aplikasi gen AI baca dan tulis dan beban kerja operasional yang menuntut kinerja real-time, ketersediaan tinggi, dan skala - membawa organisasi kecepatan, keandalan, dan dukungan multi-modal yang diperlukan untuk aplikasi AI modern.

DataStax juga terhubung dengan lancar ke Langflow, segera tersedia sebagai bagian dari IBM watsonx.ai. Langflow adalah alat sumber terbuka dengan lebih dari 60.000 bintang GitHub, yang memungkinkan pengembang membuat prototipe, membangun, dan menerapkan generasi dengan dukungan pengambilan data dan aplikasi AI multi-agen melalui antarmuka kode rendah yang intuitif untuk mengurangi gesekan pengembangan dan mempercepat time to value.

Membawa pratinjau Think 2025 kami agar tersedia bagi publik

Kami mengumumkan pratinjau tertutup dari kemampuan ini di Think 2025, sembari berbagi panggung dengan pembicara tamu terkemuka di sesi keynote Data, sesi sorotan, dan demo techbyte, yang membuka jalan bagi inovasi data dan AI di industri mereka.

Lockheed Martin bergabung dengan panggung keynote dengan Meta. Lockheed baru-baru ini memanfaatkan watsonx.data yang baru, memungkinkan 70.000 insinyur, ilmuwan, dan teknisi untuk mendapatkan jawaban dan informasi dari jutaan dokumen menggunakan bahasa alami. "Kami dengan cepat mempercepat inovasi dan efisiensi kami, untuk mendapatkan solusi dari lab dan ke lapangan, membantu menciptakan dunia yang lebih aman dan lebih aman," kata John Clark, wakil presiden senior Technology and Strategic Innovation di Lockheed.

EY baru-baru ini meluncurkan Solusi Kepatuhan Pajak Global yang didukung AI untuk mengatasi tantangan terbesar yang dihadapi departemen pajak, dibangun dengan watsonx. “EY memberikan layanan pajak di lebih dari 150 negara, dan di negara-negara tersebut, hampir semua klien kami mengalami kesulitan dengan data,” kata Christopher Aiken, Americas Indirect Tax AI Leader di EY. watsonx telah mengefisienkan upaya manusia kami untuk pembersihan, pengayaan, dan peninjauan kualitas data sebesar 30-50%.”

USAA memanfaatkan GenAI untuk mendorong masa depan asuransi dan meningkatkan pengalaman pelanggan. “Di industri asuransi, kami menangani sejumlah besar data tidak terstruktur,” kata Ramnik Bajaj, Chief Data Analytics & AI Officer di USAA. “Misalnya, laporan inspeksi rumah, laporan polisi, dan gambar kecelakaan mengandung sangat sedikit data terstruktur. Dengan AI generatif, kami memiliki kesempatan untuk mengekstrak atribut penting dan insight dari data tidak terstruktur ini, membuatnya jauh lebih mudah diakses dan berguna bagi penjamin emisi, pengatur, dan perwakilan layanan.”

Mulai dengan watsonx.data hari ini

Anda sekarang dapat memulai evolusi watsonx.data sebagai bagian dari edisi premium.

Pelajari lebih lanjut

Ikuti uji coba gratis dengan kredit gratis senilai USD 2000

Hubungi kami untuk memulai.