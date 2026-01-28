Kecerdasan Buatan Komputasi dan server Otomatisasi IT

RAG produksi untuk pencarian hukum: Bagaimana Shorthills AI menskalakan pengambilan data dengan IBM® watsonx.data

Dengan menggunakan Astra DB pada IBM® watsonx.data sebagai basis data vektor dan Langflow untuk mempercepat iterasi saat membangun sistem RAG, Shorthills memperoleh peningkatan 60% dalam recall dan presisi.

diterbitkan 28 Januari 2026
Dua pengusaha wanita terlibat dalam diskusi di meja kantor modern

Teknik kecerdasan buatan modern seperti pengambilan semantik dan Retrieval-Augmented Generation (RAG) dapat mengurangi waktu yang dihabiskan firma hukum untuk berburu dokumen panjang. Mereka bekerja dengan menemukan bagian yang relevan secara konseptual, merangkum apa yang penting dan mengembalikan kutipan yang dapat dilacak sehingga hasil dapat divalidasi.

Dilakukan dengan baik, ini mengubah penelitian hukum dari alur kerja manual, “buka-sepuluh tab” menjadi pengalaman pencarian yang dipandu dan didukung bukti tanpa mengorbankan ketelitian yang dibutuhkan tim hukum. Dalam pencarian hukum, pengguna tidak hanya membutuhkan jawaban; mereka membutuhkan jawaban yang benar. Jawaban itu harus dibuktikan dengan otoritas yang tepat, pengecualian yang relevan dan bagian-bagian yang tepat yang dapat mereka kutip—cepat.

Insight yang didukung AI untuk industri hukum

Dengan tujuan ini, Shorthills AI yang berbasis di New Jersey telah mengembangkan kerangka kerja agen AI generatif dalam bentuk chatbot yang dioptimalkan khusus domain dengan menggunakan RAG dan grafik pengetahuan. Kerangka kerja ini memberikan insight yang didukung AI untuk industri hukum, di mana relevansi, kelengkapan, dan sumber yang dapat diverifikasi sama pentingnya dengan kecepatan mentah.

Dengan menggunakan Astra DB pada IBM® watsonx.data sebagai basis data vektor dan Langflow untuk mempercepat iterasi saat membangun sistem RAG, Shorthills memperoleh peningkatan 60% dalam recall dan presisi.

Solusi IBM® juga membantu menghasilkan peningkatan 4 kali dalam komprehensif—seberapa baik hasil menangkap detail dan aspek kueri pengguna. Mereka juga memberikan peningkatan 9 kali dalam keberagaman—kemampuan untuk menawarkan pengguna berbagai interpretasi dan sudut daripada satu baris penalaran. Fitur ini sangat penting untuk menyiapkan argumen dan bantahan dalam alur kerja hukum.

Menggunakannya: Pencarian dokumen hukum skala besar yang meningkatkan relevansi, kelengkapan, dan kepercayaan

Departemen hukum yang memilah-milah kumpulan data yang terdiri dari ratusan ribu dokumen hukum membutuhkan pengambilan yang andal, berbagai sudut pandang tentang suatu masalah dan kemampuan untuk melacak hasil kembali ke dokumen sumber. Mendapatkan 70% dari jawaban dapat menimbulkan risiko yang signifikan, dan halusinasi tidak dapat diterima.

Kendala utama bagi banyak pelanggan hukum adalah penerapan. Beberapa organisasi mungkin tidak dapat berbagi data sensitif dalam konten legal dengan hyperscaler karena kendala peraturan. Kendala ini mungkin memerlukan basis pengetahuan untuk tetap ada on premises, seperti konten yang mencakup informasi identifikasi pribadi (PII) atau informasi kesehatan yang dilindungi (PHI).

Arsitektur teknis: Pipeline yang dapat diskalakan untuk pencarian RAG/kata kunci hybrid dan pengambilan grafik

Sistem AI legal Shorthills terdiri atas dua pipeline:

  1. Konsumsi dan pemrosesan dokumen dan data
  2. Sistem kueri dan pengambilan data, yang dirancang untuk mendukung berbagai mode pengambilan data—kata kunci, vektor, dan grafik—dan untuk mengarahkan kueri ke teknik yang tepat berdasarkan maksud pencarian

1. Alur pengolahan data: Dari berkas hukum mentah hingga struktur yang dapat dicari

File diimpor ke data lake dan kemudian disiapkan sehingga pengambilan bekerja dengan andal dalam skala besar:

  • Memotong dokumen menjadi potongan-potongan kecil, dengan penekanan pada pemotongan yang bermakna—bukan hanya pemisahan berdasarkan karakter dan jumlah kata—membantu melestarikan konteks seperti definisi, kutipan, dan struktur argumen.
  • Ekstraksi entitas yang didukung oleh model bahasa besar (LLM) mengidentifikasi bidang-bidang yang relevan dengan hukum, seperti nama hakim, nama kasus, jenis kasus, ID dokumen, dan jenis putusan. Kemudian diagram hubungan entitas dibangun sehingga hubungan dapat digunakan nanti selama pengambilan.
  • Menanamkan dokumen dengan model menanamkan dan menyimpan vektor yang dihasilkan mendukung pengambilan vektor dan hybrid dalam skala besar. Shorthills mengandalkan Astra DB sebagai fondasi penyimpanan untuk data yang dapat dicari.
Pemrosesan PDF dan penyimpanan data Memproses PDF dan penyimpanan data: PDF baru dibaca, dibagi menjadi potongan teks yang lebih kecil (misalnya, paragraf atau bagian) dan ID file yang diproses disimpan kembali ke CSV. Pendekatan ini membuat teks terstruktur dan terpotong yang siap untuk dianalisis dan memperbarui catatan pelacakan untuk mencegah pemrosesan ulang.
Pemotongan dan ekstraksi hubungan entitas Pemotongan dan ekstraksi hubungan entitas: Potongan dikirim ke Amazon Bedrock untuk deteksi entitas—seperti orang, organisasi—dan hubungan mereka, seperti "bekerja di", "yang terletak di". Output LLM mentah (teks tidak terstruktur) sementara di-cache dalam file JSON lokal. Data ini kemudian diurai menjadi format yang bersih dan terstruktur—entitas sebagai item berlabel dan hubungan sebagai koneksi di antara mereka. Embedding (representasi numerik) untuk setiap bagian juga dihasilkan dan disimpan dalam basis data vektor untuk pengambilan di masa mendatang.

2. Alur kueri: Perutean, pengambilan hibrida, dan penyusunan ulang peringkat berdasarkan relevansi dan latensi.

Di sisi kueri, Shorthills menggunakan filosofi pragmatis untuk lingkungan produksi mereka: hindari ketergantungan pada metode pencarian universal tunggal.

  • Pencarian kata kunci masih penting untuk pengidentifikasi yang tepat, seperti nomor dokumen atau ID.
  • Pencarian vektor meningkatkan pencocokan semantik ketika pengguna mengajukan pertanyaan bahasa alami, seperti mengenali bahwa “tampilan” dan “layar” mungkin merujuk pada konsep yang sama.
  • Pencarian grafik dapat menangkap hubungan antar dokumen, tetapi dalam skala besar bisa menjadi lambat dan lapar memori—jadi harus digunakan secara selektif.
Pipeline pencarian di atas basis pengetahuan Saluran pencarian di atas basis pengetahuan: Kueri pengguna merutekan melalui API Gateway dan menjadi pencarian hybrid (kata kunci dan vektor) yang didukung oleh Amazon Bedrock, di mana data yang relevan diambil dari watsonx. Data kemudian dilewatkan melalui lapisan de-duplikasi dan peringkat dan dikembalikan ke pengguna sebagai hasil pencarian yang disempurnakan dan kaya konteks.

Untuk menerapkan pendekatan ini, sistem mencakup router yang mengirim kueri ke pencarian kata kunci, vektor atau grafik tergantung pada maksud pengguna. Setiap opsi membawa pertukaran waktu dan biaya yang berbeda.

Pertimbangan penting lainnya termasuk:

  • Ada kebutuhan untuk implementasi pencarian hybrid yang dapat diskalakan yang menggabungkan pencarian kata kunci dan vektor dengan kemampuan grafik jika sesuai. Pendekatan ini mengoptimalkan keakuratan hasil pencarian dan mencegah sistem macet saat toko dokumen tumbuh.
  • Sistem ini mencakup tahap rangking ulang setelah pengambilan untuk meningkatkan relevansi akhir sebelum hasil dikembalikan ke pengguna.

Akhirnya, pengalaman melampaui antarmuka obrolan saja. Dalam contoh penggunaan pencarian legal ini, pengguna dapat mengambil beberapa jenis sumber data, termasuk dokumen Word, gambar, PDF, dan file teks.

Manfaat: Fleksibilitas, keamanan, dan skalabilitas

Keputusan Shorthills untuk mengembangkan platform asisten AI ini di atas teknologi IBM® didorong oleh kondisi nyata dan tantangan penerapan enterprise dalam industri hukum:

  • Dukungan lokal dan residensi data sangat penting bagi pelanggan yang dibatasi untuk memindahkan data sensitif ke hyperscaler karena toleransi risiko atau persyaratan peraturan.
  • IBM® watsonx.data membuka kemampuan untuk menskalakan pencarian di seluruh volume dokumen yang besar.
  • Keamanan kelas enterprise dan arsitektur yang dapat diskalakan memungkinkan solusi siap AI dan agen AI yang dibangun dengan IBM® watsonx.data dan Langflow, lingkungan seret dan lepas low code untuk mengembangkan agen dan pipeline RAG.

Proses-proses ini harus beroperasi dalam parameter rekayasa praktis: LLM membutuhkan komputasi dan penskalaan lokal membutuhkan waktu proses dan alat penerapan yang tepat untuk efisiensi.

Dalam hal hasil pengguna akhir yang terukur, Shorthills melaporkan:

  • Waktu pencarian lebih cepat dan peningkatan lebih dari 60% dalam ingatan dan presisi
  • Sebuah perbaikan sekitar 4 kali lipat dalam komprehensif dan 9 kali lipat dalam keberagaman
  • Dukungan yang lebih baik untuk referensi dan kutipan dalam hasil yang dikembalikan, yang sebelumnya hilang

Dampaknya konkret: peningkatan ingatan dan presisi, komprehensif dan keberagaman yang lebih tinggi dan dukungan kutipan berkualitas tinggi. Hasil ini berarti pengguna akhir menghabiskan lebih sedikit waktu berburu materi dan lebih banyak waktu untuk mengevaluasinya.

Sebuah fondasi yang dibangun untuk menskalakan

Pelajaran inti Shorthills adalah bahwa pencarian produksi untuk solusi AI adalah latihan rekayasa berulang. Penskalaan dari segelintir dokumen menjadi ribuan (dan seterusnya) mengubah masalah. Pada akhirnya, “pencarian” menjadi perjalanan peningkatan berkelanjutan — berkembang melalui pencarian kata kunci, vektor, hibrida, dan grafik, dengan routing yang cermat sehingga latensi dan biaya tetap dapat diprediksi.

Dengan membangun IBM® watsonx.data dan Langflow, Shorthills menerapkan sistem pencarian berbasis AI untuk profesional hukum yang dapat beroperasi pada skala perusahaan, menangani kendala perusahaan, termasuk persyaratan lokal. Sistem ini memberikan keuntungan relevansi yang terukur dan memberikan kutipan dan luasnya perspektif yang dibutuhkan pengguna akhir legal untuk menentukan hasil dengan percaya diri.

Kebutuhan pelanggan dan persyaratan tata kelola yang serupa ada di seluruh industri seperti layanan kesehatan dan keuangan. Skalabilitas infrastruktur yang mendasarinya memungkinkan kami untuk menerapkan solusi serupa di berbagai industri dan di seluruh dunia.

Sebagai langkah selanjutnya, Shorthills melihat fondasi pengambilan ini meluas ke alur kerja berbasis agen. Dalam alur kerja ini, agen dapat melakukan riset, menyusun draf dan mengemas output untuk ulasan oleh manusia tanpa harus membangun kembali tumpukan data dan pengambilan informasi yang mendasarinya setiap kali.

Pelajari lebih lanjut IBM watsonx.data

Paramdeep Singh

Cofounder and President

Shorthills AI

Chad Jennings

Global Head of Customer Voice and Product Experience

IBM