يواجه الذكاء الاصطناعي الفاعل مشكلة البيانات غير المنظمة، وتكشف IBM عن الحل.

6 مايو 2025

مؤلف

Edward Calvesbert

Vice President

Product Management, watsonx Platform

في مؤتمر Think هذا الأسبوع، تعمل شركة IBM على تبسيط مجموعة البيانات المخصصة للذكاء الاصطناعي بشكل جذري.

تستعرض IBM لمحة عن التطور الكبير لمنصة watsonx.data، والتي يمكن أن تساعد المؤسسات على جعل بياناتها جاهزة للذكاء الاصطناعي، وتوفِّر أساسًا مفتوحًا وهجينًا للبيانات وإدارة مؤسسية للبيانات المنظمة وغير المنظمة.

ما النتيجة؟ ذكاء اصطناعي أكثر دقة بنسبة 40% مقارنةً بأسلوب التوليد المعزز بالاسترجاع التقليدي، وذلك وفقًا لاختبارات أُجريت باستخدام IBM watsonx.data.‏1 من المتوقع إطلاق المنتجات والميزات في يونيو، وتشمل:

  • watsonx.data integration، برنامج لتنسيق الوصول إلى البيانات والهندسة عبر أنماط وتنسيقات تكامل متنوعة في واجهة واحدة، مع المرونة وقابلية التوسع في جوهره.
  • watsonx.data intelligence، برنامج يُحدِث تحولًا في الطريقة التي تستخدمها المؤسسات لتنسيق البيانات وإدارتها والاستفادة منها، مستندًا إلى قوة الذكاء الاصطناعي لتبسيط حوكمة البيانات.
  • إضافة watsonx كمزود واجهات برمجة التطبيقات (API) ضمن Llama Stack من Meta، ما يعزِّز قدرة المؤسسات على نشر الذكاء الاصطناعي التوليدي على نطاق واسع، مع الحفاظ على الانفتاح كمبدأ أساسي.

سيتوفر watsonx.data integration وwatsonx.data intelligence كمنتجات مستقلة، وستتوفر أيضًا قدرات مختارة من خلال watsonx.data، وسيساعد ذلك على زيادة الخيارات المتاحة للعملاء وتحقيق أعلى درجة من المرونة.

لاستكمال هذه المنتجات، أعلنت IBM مؤخرًا عن نيتها الاستحواذ على DataStax، التي تتميز بقدرتها على توظيف البيانات غير المنظمة لصالح الذكاء الاصطناعي التوليدي. باستخدام DataStax، يمكن للعملاء الوصول إلى قدرات بحث متجهية إضافية.

استنادًا إلى اختبارات داخلية تقارن دقة الإجابات التي تقدمها نماذج الذكاء الاصطناعي عند استخدام طبقة الاسترجاع في watsonx.data Premium Edition، مقابل الاعتماد على التوليد المعزز بالاسترجاع القائم على المتجهات فقط في ثلاث حالات استخدام شائعة، باستخدام مجموعات بيانات خاصة بشركة IBM، وبنفس مجموعة النماذج مفتوحة المصدر المختارة للاستدلال، والتقييم، والتضمين، إلى جانب متغيرات إضافية. وقد تختلف النتائج.

سياق هذا التطور الكبير

تواجه المؤسسات حاجزًا رئيسيًا أمام تحقيق الذكاء الاصطناعي التوليدي الدقيق وعالي الأداء، خاصةً الذكاء الاصطناعي الفاعل. لكن الحاجز ليس ما يعتقده معظم قادة الأعمال.

المشكلة ليست في تكاليف الاستدلال أو النموذج "المثالي" الغامض. المشكلة هي البيانات.

تحتاج المؤسسات إلى بيانات موثوق بها وخاصة بالشركة كي يتمكن الذكاء الاصطناعي الفاعل من تحقيق قيمة حقيقية - وهي البيانات غير المنظمة داخل البريد الإلكتروني، والمستندات، والعروض التقديمية، ومقاطع الفيديو. تُقدَّر نسبة البيانات غير المنظمة التي تولِّدها المؤسسات في عام 2022 بنسبة 90%، إلا أن IBM تتوقع أن 1% فقط منها يتم تضمينه في النماذج اللغوية الكبيرة (LLMs).

يمكن أن يكون من الصعب جدًا استغلال البيانات غير المنظمة. تكون البيانات موزعة بشكل كبير ومتغيرة باستمرار، ومحتجزة داخل صيغ متنوعة، وتفتقر إلى تسميات واضحة، وغالبًا ما تحتاج إلى سياق إضافي لفهمها بشكل كامل. لا ينجح الأسلوب التقليدي في التوليد المعزز بالاسترجاع (RAG) في استخراج القيمة بشكل فعَّال، ولا يمكنه الجمع بين البيانات غير المنظمة والمنظمة بشكل صحيح.

في الوقت نفسه، وجود أدوات كثيرة غير متصلة ببعضها يجعل بنية البيانات الخاصة بالذكاء الاصطناعي معقدة وصعبة الاستخدام. تُدير المؤسسات مستودعات البيانات، وبحيرات البيانات، وأدوات حوكمة البيانات وتكاملها. قد تبدو بنية البيانات مربكة بقدر ما تبدو البيانات غير المنظمة التي يُفترض بها إدارتها.

عدد كبير من المؤسسات لا تركِّز على جذور المشكلة. بل تركِّز فقط على طبقة تطبيقات الذكاء الاصطناعي التوليدي، بدلًا من طبقة البيانات الأساسية تحتها. وإلى أن تقوم المؤسسات بإصلاح أساس بياناتها، فلن يستطيع وكلاء الذكاء الاصطناعي والمبادرات الأخرى للذكاء الاصطناعي التوليدي تحقيق كامل إمكاناتهم.

مساعدة المؤسسات على جعل بياناتها جاهزة للذكاء الاصطناعي

ستُتيح قدرات IBM الجديدة للمؤسسات استيعاب وحوكمة واسترجاع البيانات غير المنظمة (والمنظمة)، ومن ثمَّ تطوير ذكاء اصطناعي توليدي دقيق وعالي الأداء.

سجّل للحصول على التحديثات

أحدث أخبار المنتجات من IBM

تعرَّف على أبرز المنتجات والميزات الجديدة التي أعلنت عنها IBM، بما في ذلك محادثات الفيديو الأخيرة حول المنتجات والعروض التعليمية من IBM وشركائنا في التدريب. راجِع بيان الخصوصية لشركة IBM.

شكرًا لك! أنت مشترك.