Kami dengan bangga mengumumkan kemitraan baru antara IBM dan Unstructured, sebuah perusahaan portofolio IBM Ventures. Bersama-sama, kami mengatasi salah satu hambatan paling signifikan untuk meningkatkan skala AI perusahaan: persiapan data tidak terstruktur untuk AI generatif.
Sekitar 80% data perusahaan tidak terstruktur—berada dalam PDF, email, platform kolaborasi, dan repositori dokumen. Namun kurang dari 1% dari data ini berada dalam format yang cocok untuk langsung digunakan oleh AI. Kesenjangan ini merupakan peluang besar sekaligus tantangan penting bagi organisasi yang meningkatkan skala inisiatif AI.
Pendekatan tradisional pada persiapan data tidak terstruktur menahan perusahaan. Saluran manual membutuhkan waktu 6-12 bulan untuk membangunnya dan tetap saja rapuh, mengalami kerusakan setiap kali diterapkan format dokumen baru atau perubahan pada sistem sumber. Tim teknik menghabiskan waktu berharga untuk pembangunan dan pemeliharaan sistem daripada inovasi AI. Tanpa struktur dan konsistensi yang tepat, model AI memberikan hasil yang tidak dapat diandalkan, merusak kepercayaan, dan menunda time to value.
IBM watsonx.data menjawab tantangan ini sebagai satu-satunya data lakehouse hybrid dan terbuka di industri yang dibangun untuk AI dan analitik. Data lakehouse ini menyederhanakan akses, persiapan, dan tata kelola di data terstruktur maupun tidak terstruktur, membantu organisasi membangun fondasi data tepercaya untuk AI generatif dalam skala besar.
Melalui kemitraan ini, Unstructured memperluas kekuatan watsonx.data untuk mengakses dan mengubah data tidak terstruktur menjadi format siap AI untuk mendorong AI generatif yang andal, dapat diskalakan, dan tepercaya.
Unstructured menyediakan lebih dari 30 konektor yang dibangun sebelumnya pada sumber data perusahaan termasuk SharePoint, Google Drive, Salesforce, Confluence, Box, dan Dropbox. Dengan dukungan untuk lebih dari 70 jenis file—mulai dari PDF dengan tata letak yang kompleks hingga gambar yang dipindai, email, dan dokumen Microsoft Office—organisasi dapat mengakses dan mengubah kekayaan data lengkap mereka.
Tidak seperti alat ekstraksi teks dasar, pemahaman dokumen cerdas Unstructured mempertahankan berbagai elemen penting seperti tabel, hierarki, dan struktur semantik, memastikan model AI menerima data yang kaya secara kontekstual, bukan hanya teks mentah.
Pembuat alur kerja no-code memberdayakan tim bisnis dan data untuk merancang dan mengelola saluran data tanpa memerlukan sumber daya teknik khusus. Untuk organisasi dengan tim pengembangan, API yang komprehensif memberikan kontrol terprogram dan opsi penyesuaian.
Proses sinkronisasi otomatis bertahap hanya menyerap dokumen baru dan yang diubah, sehingga mengurangi biaya komputasi dan menjaga aplikasi AI tetap terkini. Orkestrasi dengan banyak sumber mengoordinasikan aliran data di berbagai sistem secara bersamaan, sehingga menghilangkan biaya overhead koordinasi manual.
Unstructured sesuai dengan SOC 2 Tipe II, HIPAA, dan GDPR, memenuhi standar keamanan dan privasi ketat yang dibutuhkan oleh divisi TI perusahaan. Bersama dengan watsonx.data, solusi ini memberikan kontrol versi, pelacakan silsilah data, dan kontrol akses terperinci yang memenuhi izin sistem sumber di seluruh saluran data.
Unstructured memberikan data yang diperkaya secara semantik dan dipotong dengan benar yang dioptimalkan untuk arsitektur AI modern:
Dengan watsonx.data dan Unstructured, tim dapat beralih dengan cepat dengan saluran siap produksi yang menggabungkan kecepatan, fleksibilitas, dan kesiapan AI dalam satu solusi terpadu.
Jika watsonx.data adalah mesin data yang menggerakkan aplikasi AI generatif, Unstructured menyediakan bahan bakarnya. Bersama-sama, watsonx.data dan Unstructured memberikan data tidak terstruktur siap AI dan memungkinkan pola pembuatan respons dengan pengambilan data yang ditingkatkan tingkat lanjut meningkatkan akurasi dan keandalan AI.
Perusahaan dapat mempercepat time to value dengan mengganti persiapan dokumen manual dengan pemrosesan otomatis dan cerdas. Kebijakan tata kelola mengalir dari sistem sumber dokumen hingga aplikasi AI, meningkatkan kepercayaan dan transparansi di setiap tahap. Dengan menghilangkan hambatan persiapan data tidak terstruktur dan menyediakan landasan data dengan akses, persiapan, dan tata kelola data terpadu, organisasi akhirnya dapat membuka potensi penuh dari konten tidak terstruktur mereka untuk mendukung AI kelas perusahaan yang andal.
Untuk melihat aksi watsonx.data dan Unstructured, bergabunglah dengan webinar bersama kami yang akan datang atau pesan rapat. Bersama-sama, kami akan membantu Anda beralih dari menghabiskan waktu menyiapkan data tidak terstruktur yang berantakan ke mempercepat agen dan aplikasi AI kelas perusahaan, didukung oleh data siap AI, dalam skala besar.