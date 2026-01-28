الذكاء الاصطناعي الحوسبة والخوادم أتمتة تكنولوجيا المعلومات

التوليد المعزز بالاسترجاع المخصص للإنتاج في البحث القانوني: كيف وسعت Shorthills AI نطاق استرجاع البيانات باستخدام IBM watsonx.data

باستخدام Astra DB على ®IBM® watsonx.data بوصفها قاعدة بيانات متجهات واستخدام Langflow لتسريع عمليات التكرار عند إنشاء أنظمة التوليد المعزز بالاسترجاع، حققت Shorthills تحسنًا بنسبة 60% في الاستدعاء والدقة.

تاريخ النشر 28 يناير 2026
يمكن لتقنيات الذكاء الاصطناعي الحديثة، مثل الاسترجاع الدلالي والتوليد المعزز بالاسترجاع (RAG)، أن تقلل من الوقت الذي تكرسه شركات المحاماة للبحث في الوثائق الطويلة. وهي تعمل من خلال العثور على الأقسام ذات الصلة من الناحية المفاهيمية، وتلخيص ما هو مهم، وإرجاع الاستشهادات القابلة للتتبع حتى يمكن التحقق من صحة النتائج.

عند تنفيذ تلك التقنيات بإتقان، يتحول البحث القانوني من سير عمل يدوي يستهلك الوقت إلى تجربة بحث موجهة ومدعومة بالأدلة من دون التضحية بالدقة التي تتطلبها الفرق القانونية. في البحث القانوني، لا يحتاج المستخدمون إلى إجابة فحسب، بل يحتاجون إلى الإجابة الصحيحة. ويجب أن تكون هذه الإجابة مدعومة بالمراجع القانونية المناسبة والاستثناءات ذات الصلة والمقاطع الدقيقة التي يمكنهم الاستشهاد بها بسرعة.

رؤى مدعومة بالذكاء الاصطناعي للقطاع القانوني

مع وضع هذا الهدف في الحسبان، طورت شركة Shorthills AI -التي تتخذ من نيوجيرسي مقرًا لها- إطار عمل وكيل ذكاء اصطناعي توليدي في شكل روبوتات محادثة محسّنة خاصة بالمجال باستخدام التوليد المعزز بالاسترجاع ومخطط المعرفة. ويوفر هذا الإطار رؤى مدعومة بالذكاء الاصطناعي للقطاع القانوني، حيث تهم الصلة والكمال والمصادر القابلة للتحقق بقدر ما تهم السرعة المجردة.

باستخدام Astra DB على IBM watsonx.data بوصفها قاعدة بيانات متجهات واستخدام Langflow لتسريع عمليات التكرار عند إنشاء أنظمة التوليد المعزز بالاسترجاع، حققت Shorthills تحسنًا بنسبة 60% في الاستدعاء والدقة.

تساعد حلول IBM أيضًا على تحسين الشمولية، أي مدى جودة النتائج في التقاط تفاصيل استعلام المستخدم وجوانبه، بمقدار 4 أضعاف. كما أنها تحسن التنوع، أي القدرة على تقديم تفسيرات وزوايا متعددة للمستخدمين بدلاً من خط واحد من التفكير المنطقي، بمقدار 9 أضعاف. وهذه الميزة مهمة للغاية لإعداد الحجج والردود في مهام سير العمل القانونية.

التطبيق العملي: البحث في المستندات القانونية على نطاق واسع لتحسين الصلة والاكتمال والثقة

تحتاج الإدارات القانونية التي تبحث في مجموعة بيانات تضم مئات الآلاف من المستندات القانونية إلى قدرة على الاسترجاع جديرة بالثقة، وزوايا متعددة للنظر في القضية، والقدرة على تتبع النتائج إلى المستندات وصولاً إلى المصادر الأصلية. وقد يشكل الحصول على 70% من الإجابة مخاطر كبيرة، كما أن الهلوسة غير مقبولة.

يعد النشر أحد القيود الرئيسية للعديد من العملاء القانونيين. قد لا تتمكن بعض المؤسسات من مشاركة البيانات الحساسة في المحتوى القانوني مع مزودي خدمات السحابة العملاقة بسبب القيود التنظيمية. وقد تتطلب هذه القيود بقاء قاعدة المعرفة محليًا، مثل المحتوى الذي يتضمن معلومات التعريف الشخصية (PII) أو المعلومات الصحية المحمية (PHI).

البنية التقنية: مسار قابل للتوسع للبحث الهجين بالتوليد المعزز بالاسترجاع/الكلمات المفتاحية واسترجاع الرسوم البيانية

يتكون نظام الذكاء الاصطناعي القانوني لشركة Shorthills من مسارين:

  1. استيعاب الوثائق والبيانات ومعالجتها
  2. الاستعلام والاسترجاع، المصمم لدعم أوضاع استرجاع متعددة — الكلمات المفتاحية والمتجهات والرسوم البيانية — وتوجيه الاستعلامات إلى التقنية المناسبة بناءً على النية

1. مسار الاستيعاب: تحويل الملفات القانونية الأولية إلى هياكل قابلة للبحث

تُستورد الملفات إلى بحيرة بيانات ثم تُجهز بحيث يعمل الاسترجاع بشكل جدير بالثقة على نطاق واسع:

  • يساعد تقسيم المستندات إلى أجزاء أصغر، مع التركيز على التقسيم الدلالي — وليس مجرد التقسيم حسب عدد الأحرف والكلمات — على الحفاظ على السياق مثل التعريفات والاستشهادات وهياكل الحجج.
  • يحدد استخراج الكيانات المدعوم بنموذج لغوي كبير (LLM) الحقول ذات الصلة قانونيًا، مثل اسم القاضي واسم القضية ونوع القضية ومعرفات المستندات ونوع الحكم. ثم يُنشَأ مخطط علاقات الكيانات بحيث يمكن استخدام العلاقات لاحقًا في أثناء الاسترجاع.
  • يدعم تضمين المستندات بنموذج تضمين وتخزين المتجهات الناتجة الاسترجاع المتجه والهجين على نطاق واسع. وتعتمد Shorthills على Astra DB كأساس تخزين للبيانات القابلة للبحث.
معالجة ملفات PDF وتخزين البيانات معالجة ملفات PDF وتخزين البيانات: تُقرأ ملفات PDF الجديدة، وتُقسم إلى أجزاء نصية أصغر (على سبيل المثال، فقرات أو أقسام) وتُحفظ معرفات الملفات المعالجة مرة أخرى في ملف CSV. وينتج عن هذا النهج نص منظم ومقسم إلى أجزاء جاهز للتحليل، ويُحدث سجل التتبع لمنع إعادة المعالجة.
تقسيم النصوص واستخراج علاقات الكيانات تقسيم النصوص واستخراج علاقات الكيانات: تُرسل النصوص المقسمة إلى Amazon Bedrock لاكتشاف الكيانات — مثل الأشخاص والمنظمات — والعلاقات القائمة بينها، مثل "يعمل في" و"يقع في". ويُخزن ناتج النموذج اللغوي الكبير الأولي (نص غير منظم) مؤقتًا في ملف JSON محلي. ثم تُحلل هذه البيانات إلى تنسيقات نظيفة ومنظمة — الكيانات كعناصر مصنفة والعلاقات كروابط بينها. كما تُنشأ أيضًا التضمينات (التمثيلات الرقمية) للأجزاء المقسمة وتُخزن في قاعدة بيانات متجهات لاسترجاعها في المستقبل.

2. مسار الاستعلام: التوجيه والاسترجاع الهجين وإعادة التصنيف لضمان الدقة والسرعة

على صعيد الاستعلام، تستخدم Shorthills فلسفة براغماتية لبيئة الإنتاج الخاصة بها: تجنب الاعتماد على طريقة بحث عالمية واحدة.

  • لا يزال البحث بالكلمات المفتاحية مهمًا للمعرفات الدقيقة، مثل أرقام المستندات أو المعرفات.
  • يحسن البحث بالمتجهات المطابقة الدلالية عندما يطرح المستخدمون أسئلة باللغة الطبيعية، كإدراك أن كلمتي "عرض" و"شاشة" قد تشيران إلى المفهوم ذاته.
  • يمكن للبحث القائم على الرسوم البيانية التقاط الروابط بين المستندات، ولكن على نطاق واسع يمكن أن يصبح بطيئًا ويستهلك الكثير من الذاكرة، لذلك يجب استخدامه بشكل انتقائي.
مسار البحث القائم على قاعدة المعرفة مسار البحث القائم على قاعدة المعرفة: يوجه استعلام المستخدم عبر بوابة واجهة برمجة التطبيقات ويصبح بحثًا هجينًا (بالكلمات المفتاحية والمتجهات) مدعومًا من Amazon Bedrock، حيث تُسترجع البيانات ذات الصلة من watsonx. ثم تُمرر البيانات عبر طبقة إزالة التكرار والتصنيف وتُعاد إلى المستخدم كنتيجة بحث منقحة وغنية بالسياق.

لتنفيذ هذا النهج، يتضمن النظام أجهزة توجيه ترسل الاستعلام إلى البحث بالكلمات المفتاحية أو المتجهات أو الرسوم البيانية حسب نية المستخدم. وكل خيار له مزايا وعيوب مختلفة من حيث الوقت والتكلفة.

تضمنت الاعتبارات المهمة الأخرى ما يلي:

  • هناك حاجة إلى تنفيذ بحث هجين قابل للتوسع يجمع بين البحث بالكلمات المفتاحية والمتجهات مع إمكانات الرسوم البيانية عند الاقتضاء. ويعمل هذا النهج على تحسين دقة نتائج البحث ويمنع تعطل الأنظمة مع نمو مخزن المستندات.
  • يتضمن النظام مرحلة إعادة التصنيف بعد الاسترجاع لتحسين مستوى الصلة النهائي قبل إرجاع النتائج إلى المستخدم.

وأخيرًا، تتجاوز التجربة مجرد التفاعل عبر واجهة محادثة. ففي حالة استخدام البحث القانوني هذه، يمكن للمستخدمين استرجاع أنواع متعددة من مصادر البيانات، بما في ذلك مستندات Word والصور وملفات PDF والملفات النصية.

المزايا: المرونة والأمان وقابلية التوسع

أحد الأسباب الرئيسية التي دفعت Shorthills إلى بناء منصة المساعد الذكي هذه باستخدام مجموعة IBM هو واقع نشر المؤسسات في عالم القانون:

  • يعد الدعم المحلي وتخزين البيانات أمرًا ضروريًا للعملاء الممنوعين من نقل البيانات الحساسة إلى مزودي خدمات السحابة العملاقة بسبب متطلبات المخاطر أو المتطلبات التنظيمية.
  • يتيح IBM watsonx.data إمكانية توسيع نطاق البحث عبر أحجام كبيرة من المستندات.
  • يتيح الأمان بمستوى المؤسسات والبنية القابلة للتوسع حلولاً جاهزة للذكاء الاصطناعي ووكلاء ذكاء اصطناعي مبنيين باستخدام IBM watsonx.data وLangflow، وهي بيئة منخفضة الكود تعمل بالسحب والإفلات لتطوير الوكلاء ومسار التوليد المعزز بالاسترجاع.

كان لا بد أن تعمل هذه العمليات ضمن معايير هندسية عملية: تتطلب النماذج اللغوية الكبيرة قدرًا كبيرًا من موارد الحوسبة، ويتطلب التوسع محليًا أدوات تشغيل ونشر مناسبة لتحقيق الكفاءة.

فيما يتعلق بالنتائج القابلة للقياس للمستخدم النهائي، أفادت Shorthills بما يلي:

  • وقت بحث أسرع وتحسن بنسبة تزيد على 60% في الاستدعاء والدقة.
  • تحسن يقارب 4 أضعاف في الشمولية و9 أضعاف في التنوع.
  • دعم أفضل للمراجع والاستشهادات في النتائج المعروضة التي كانت مفقودة في السابق.

تأثير ملموس: تحسن الاستدعاء والدقة وشمولية وتنوع أعلى ودعم عالي الجودة للاستشهادات. وتترجم هذه النتيجة إلى قضاء المستخدمين النهائيين وقتًا أقل في البحث عن المواد ووقتًا أطول في تقييمها.

أساس مُهيأ للتوسع

كان الدرس الأساسي الذي تعلمته Shorthills هو أن البحث في بيئات الإنتاج عن حلول الذكاء الاصطناعي هو عملية هندسية متكررة. إذ إن الانتقال من التعامل مع بضعة مستندات إلى الآلاف (وما بعدها) يغير طبيعة المشكلة. وفي النهاية، يصبح "البحث" رحلة من التحسين المستمر — يتطور من خلال البحث بالكلمات المفتاحية والمتجهات والبحث الهجين والبحث القائم على الرسوم البيانية، مع توجيه دقيق بحيث يظل زمن الاستجابة والتكلفة قابلين للتنبؤ.

بالاعتماد على IBM watsonx.data وLangflow، نفذت Shorthills نظام بحث مدعومًا بالذكاء الاصطناعي للمهنيين القانونيين يمكنه العمل على نطاق المؤسسة، والتعامل مع قيود المؤسسة، بما في ذلك المتطلبات المحلية. يوفر النظام مكاسب في صلة النتائج قابلة للقياس، ويقدم الاستشهادات واتساع نطاق وجهات النظر التي يحتاجها المستخدمون النهائيون القانونيون لتحديد النتائج بثقة.

توجد احتياجات عملاء ومتطلبات حوكمة مماثلة في مختلف الصناعات مثل الرعاية الصحية والخدمات المالية. وتتيح قابلية التوسع في البنية التحتية الأساسية لنا نشر حلول مماثلة في صناعات متعددة وفي كل أنحاء العالم.

كخطوة تالية، ترى Shorthills أن أساس الاسترجاع هذا سيمتد إلى مهام سير عمل قائمة على الوكلاء. ففي مهام سير العمل هذه، يمكن للوكيل البحث وصياغة النتائج وتجميعها لمراجعتها من قِبل البشر من دون الحاجة إلى إعادة بناء البيانات الأساسية ومجموعة الاسترجاع في كل مرة.

