IBM watsonx.data plus Unstructured: Mengubah data tidak terstruktur menjadi bahan bakar yang siap AI

Ilustrasi digital dengan latar belakang dalam gradasi warna hitam ke ungu dengan dasbor di sisi kanan yang menunjukkan beberapa jendela, sebuah kalender, dan sejumlah ikon

Penulis

Edward Calvesbert

Vice President, Product Management - watsonx.data

IBM

Brian Raymond

Founder and CEO of Unstructured

Kami dengan bangga mengumumkan kemitraan baru antara IBM dan Unstructured, sebuah perusahaan portofolio IBM Ventures. Bersama-sama, kami mengatasi salah satu hambatan paling signifikan untuk meningkatkan skala AI perusahaan: persiapan data tidak terstruktur untuk AI generatif.

Tantangan data tidak terstruktur

Sekitar 80% data perusahaan tidak terstruktur—berada dalam PDF, email, platform kolaborasi, dan repositori dokumen. Namun kurang dari 1% dari data ini berada dalam format yang cocok untuk langsung digunakan oleh AI. Kesenjangan ini merupakan peluang besar sekaligus tantangan penting bagi organisasi​​​​ yang meningkatkan skala inisiatif AI.​​​​​​

​​​​Pendekatan tradisional pada persiapan data tidak terstruktur menahan perusahaan. Saluran manual membutuhkan waktu 6-12 bulan untuk membangunnya dan tetap saja rapuh, mengalami kerusakan setiap kali diterapkan format dokumen baru atau perubahan pada sistem sumber. Tim teknik menghabiskan waktu berharga untuk pembangunan dan pemeliharaan sistem daripada inovasi AI. Tanpa struktur dan konsistensi yang tepat, model AI memberikan hasil yang tidak dapat diandalkan, merusak kepercayaan, dan menunda time to value.​​​

​​​​IBM watsonx.data menjawab tantangan ini sebagai satu-satunya data lakehouse hybrid dan terbuka di industri yang dibangun untuk AI dan analitik. Data lakehouse ini menyederhanakan akses, persiapan, dan tata kelola di data terstruktur maupun tidak terstruktur, membantu organisasi membangun fondasi data tepercaya untuk AI generatif dalam skala besar.​​​​​

Keuntungan watsonx.data “Unstructured”

Melalui kemitraan ini, Unstructured memperluas kekuatan watsonx.data untuk mengakses dan mengubah data tidak terstruktur menjadi format siap AI untuk mendorong AI generatif yang andal, dapat diskalakan, dan tepercaya.

Dukungan konektivitas dan format yang komprehensif​​​

Unstructured menyediakan lebih dari 30 konektor yang dibangun sebelumnya pada sumber data perusahaan termasuk SharePoint, Google Drive, Salesforce, Confluence, Box, dan Dropbox. Dengan dukungan untuk lebih dari 70 jenis file—mulai dari PDF dengan tata letak yang kompleks hingga gambar yang dipindai, email, dan dokumen Microsoft Office—organisasi dapat mengakses dan mengubah kekayaan data lengkap mereka.​​​

​​​​Tidak seperti alat ekstraksi teks dasar, pemahaman dokumen cerdas Unstructured mempertahankan berbagai elemen penting seperti tabel, hierarki, dan struktur semantik, memastikan model AI menerima data yang kaya secara kontekstual, bukan hanya teks mentah.​​​​​

Pengembangan saluran yang dipercepat​​​

Pembuat alur kerja no-code memberdayakan tim bisnis dan data untuk merancang dan mengelola saluran data tanpa memerlukan sumber daya teknik khusus. Untuk organisasi dengan tim pengembangan, API yang komprehensif memberikan kontrol terprogram dan opsi penyesuaian.​​​

​​​​Proses sinkronisasi otomatis bertahap hanya menyerap dokumen baru dan yang diubah, sehingga mengurangi biaya komputasi dan menjaga aplikasi AI tetap terkini. Orkestrasi dengan banyak sumber mengoordinasikan aliran data di berbagai sistem secara bersamaan, sehingga menghilangkan biaya overhead koordinasi manual.​​​

Tata kelola dan kepatuhan kelas perusahaan

Unstructured sesuai dengan SOC 2 Tipe II, HIPAA, dan GDPR, memenuhi standar keamanan dan privasi ketat yang dibutuhkan oleh divisi TI perusahaan. Bersama dengan watsonx.data, solusi ini memberikan kontrol versi, pelacakan silsilah data, dan kontrol akses terperinci yang memenuhi izin sistem sumber di seluruh saluran data.​​​

Dioptimalkan untuk alur kerja AI​​​

Unstructured memberikan data yang diperkaya secara semantik dan dipotong dengan benar yang dioptimalkan untuk arsitektur AI modern:​​​

  • Retrieval-augmented generation (RAG):​​ Pemotongan yang cerdas secara kontekstual meningkatkan akurasi pengambilan dan kualitas respons​​​
  • Integrasi basis data vektor:​​ Pembuatan penanaman otomatis merampingkan penyerapan ke dalam penyimpanan vektor​​​
  • Sistem agen:​​ Menyediakan konteks terstruktur dan dapat ditindaklanjuti yang memungkinkan agen otonom untuk bernalar, merencanakan, dan berinteraksi dengan data secara lebih efektif​​​​​
  • AI multimodal:​​ Pemrosesan konten teks dan gambar yang terkoordinasi​​​

Dengan watsonx.data dan Unstructured, tim dapat beralih dengan cepat dengan saluran siap produksi ​​yang menggabungkan​​​​ kecepatan, fleksibilitas, dan kesiapan AI dalam satu solusi terpadu.

Lebih baik bersama: Mengisi bahan bakar mesin watsonx

Jika watsonx.data adalah mesin data yang menggerakkan aplikasi AI generatif, Unstructured menyediakan bahan bakarnya. Bersama-sama, watsonx.data dan Unstructured memberikan data tidak terstruktur siap AI dan memungkinkan pola pembuatan respons dengan pengambilan data yang ditingkatkan tingkat lanjut meningkatkan akurasi dan keandalan AI. 

Perusahaan dapat mempercepat time to value dengan mengganti persiapan dokumen manual dengan pemrosesan otomatis dan cerdas. Kebijakan tata kelola mengalir dari sistem sumber dokumen hingga aplikasi AI, meningkatkan kepercayaan dan transparansi di setiap tahap. Dengan menghilangkan hambatan persiapan data tidak terstruktur dan menyediakan landasan data dengan akses, persiapan, dan tata kelola data terpadu, organisasi akhirnya dapat membuka potensi penuh dari konten tidak terstruktur mereka untuk mendukung AI kelas perusahaan yang andal.

Untuk melihat aksi watsonx.data dan Unstructured, bergabunglah dengan webinar bersama kami yang akan datang atau pesan rapat. Bersama-sama, kami akan membantu Anda beralih dari​ menghabiskan waktu​ menyiapkan data tidak terstruktur yang berantakan​​ ​​ke mempercepat agen dan aplikasi AI kelas perusahaan, didukung oleh data siap AI, dalam skala besar.​​​

Bergabunglah dengan webinar yang akan datang

Jadwalkan pertemuan