6 مايو 2025
في مؤتمر Think هذا الأسبوع، تعمل شركة IBM على تبسيط مجموعة البيانات المخصصة للذكاء الاصطناعي بشكل جذري.
تستعرض IBM لمحة عن التطور الكبير لمنصة watsonx.data، والتي يمكن أن تساعد المؤسسات على جعل بياناتها جاهزة للذكاء الاصطناعي، وتوفِّر أساسًا مفتوحًا وهجينًا للبيانات وإدارة مؤسسية للبيانات المنظمة وغير المنظمة.
ما النتيجة؟ ذكاء اصطناعي أكثر دقة بنسبة 40% مقارنةً بأسلوب التوليد المعزز بالاسترجاع التقليدي، وذلك وفقًا لاختبارات أُجريت باستخدام IBM watsonx.data.1 من المتوقع إطلاق المنتجات والميزات في يونيو، وتشمل:
سيتوفر watsonx.data integration وwatsonx.data intelligence كمنتجات مستقلة، وستتوفر أيضًا قدرات مختارة من خلال watsonx.data، وسيساعد ذلك على زيادة الخيارات المتاحة للعملاء وتحقيق أعلى درجة من المرونة.
لاستكمال هذه المنتجات، أعلنت IBM مؤخرًا عن نيتها الاستحواذ على DataStax، التي تتميز بقدرتها على توظيف البيانات غير المنظمة لصالح الذكاء الاصطناعي التوليدي. باستخدام DataStax، يمكن للعملاء الوصول إلى قدرات بحث متجهية إضافية.
استنادًا إلى اختبارات داخلية تقارن دقة الإجابات التي تقدمها نماذج الذكاء الاصطناعي عند استخدام طبقة الاسترجاع في watsonx.data Premium Edition، مقابل الاعتماد على التوليد المعزز بالاسترجاع القائم على المتجهات فقط في ثلاث حالات استخدام شائعة، باستخدام مجموعات بيانات خاصة بشركة IBM، وبنفس مجموعة النماذج مفتوحة المصدر المختارة للاستدلال، والتقييم، والتضمين، إلى جانب متغيرات إضافية. وقد تختلف النتائج.
تواجه المؤسسات حاجزًا رئيسيًا أمام تحقيق الذكاء الاصطناعي التوليدي الدقيق وعالي الأداء، خاصةً الذكاء الاصطناعي الفاعل. لكن الحاجز ليس ما يعتقده معظم قادة الأعمال.
المشكلة ليست في تكاليف الاستدلال أو النموذج "المثالي" الغامض. المشكلة هي البيانات.
تحتاج المؤسسات إلى بيانات موثوق بها وخاصة بالشركة كي يتمكن الذكاء الاصطناعي الفاعل من تحقيق قيمة حقيقية - وهي البيانات غير المنظمة داخل البريد الإلكتروني، والمستندات، والعروض التقديمية، ومقاطع الفيديو. تُقدَّر نسبة البيانات غير المنظمة التي تولِّدها المؤسسات في عام 2022 بنسبة 90%، إلا أن IBM تتوقع أن 1% فقط منها يتم تضمينه في النماذج اللغوية الكبيرة (LLMs).
يمكن أن يكون من الصعب جدًا استغلال البيانات غير المنظمة. تكون البيانات موزعة بشكل كبير ومتغيرة باستمرار، ومحتجزة داخل صيغ متنوعة، وتفتقر إلى تسميات واضحة، وغالبًا ما تحتاج إلى سياق إضافي لفهمها بشكل كامل. لا ينجح الأسلوب التقليدي في التوليد المعزز بالاسترجاع (RAG) في استخراج القيمة بشكل فعَّال، ولا يمكنه الجمع بين البيانات غير المنظمة والمنظمة بشكل صحيح.
في الوقت نفسه، وجود أدوات كثيرة غير متصلة ببعضها يجعل بنية البيانات الخاصة بالذكاء الاصطناعي معقدة وصعبة الاستخدام. تُدير المؤسسات مستودعات البيانات، وبحيرات البيانات، وأدوات حوكمة البيانات وتكاملها. قد تبدو بنية البيانات مربكة بقدر ما تبدو البيانات غير المنظمة التي يُفترض بها إدارتها.
عدد كبير من المؤسسات لا تركِّز على جذور المشكلة. بل تركِّز فقط على طبقة تطبيقات الذكاء الاصطناعي التوليدي، بدلًا من طبقة البيانات الأساسية تحتها. وإلى أن تقوم المؤسسات بإصلاح أساس بياناتها، فلن يستطيع وكلاء الذكاء الاصطناعي والمبادرات الأخرى للذكاء الاصطناعي التوليدي تحقيق كامل إمكاناتهم.
ستُتيح قدرات IBM الجديدة للمؤسسات استيعاب وحوكمة واسترجاع البيانات غير المنظمة (والمنظمة)، ومن ثمَّ تطوير ذكاء اصطناعي توليدي دقيق وعالي الأداء.
ما الجديد في رسالة IBM الإخبارية
تعرَّف على أبرز المنتجات والميزات الجديدة التي أعلنت عنها IBM، بما في ذلك محادثات الفيديو الأخيرة حول المنتجات والعروض التعليمية من IBM وشركائنا في التدريب. راجِع بيان الخصوصية لشركة IBM.