بفضل ChatGPT والعشرات من روبوتات المحادثة الأخرى المبنية على نماذج الأساس، أصبح الجميع تقريبًا يعرفون النماذج اللغوية الكبرى (LLMs). ولكن ماذا عن نماذج قواعد البيانات الكبيرة (LDMs)؟
يقول Ric Lewis، نائب الرئيس الأول لقسم البنية التحتية في IBM، خلال يوم المستثمرين لعام 2025 في IBM: "نماذج قواعد البيانات الكبيرة هي نماذج مضبوطة لاستخلاص المعارف من مجموعات بيانات كبيرة وتدفقات المعاملات بدلاً من اللغة والنصوص البشرية، التي هي مجال النماذج اللغوية الكبرى وروبوتات المحادثة."
بينما تتدرب النماذج اللغوية الكبرى على البيانات المتاحة للجمهور مثل الكتب والمقالات وWikipedia ومصادر أخرى متنوعة، إلا أن مواد تدريبها لا تتضمن عادةً الكمية الهائلة من البيانات المتوفرة داخل المؤسسات. في الواقع، المستخدم حاليًا في النماذج اللغوية الكبرى هو 1% فقط من البيانات المؤسسية .
في المقابل، تتدرب نماذج قواعد البيانات الكبيرة على سجلات المعاملات ومعلومات المنتجات وبيانات علاقات العملاء وسجلات التدريب وسجلات الموظفين، من بين مصادر أخرى للبيانات المؤسسية. ونتيجة لذلك، تستطيع الشركات استخدام نماذج قواعد البيانات الكبيرة لاكتشاف المعارف الكامنة في 99% من البيانات غير المستغلة ضمن قواعد بياناتها باستخدام الأسئلة الحوارية، في عملية تعرف باسم البحث الدلالي. يتجاوز البحث الدلالي مطابقة الكلمات المفتاحية لفهم المعنى والسياق الكامن وراء استعلام بحث المستخدم.
يقول Lewis في مقابلة مع IBM Think: "تمثل نماذج قواعد البيانات الكبيرة طريقة جديدة ومثيرة للاستفادة من البيانات المدمجة في تطبيقات الأعمال وتدفقات المعاملات لاستخراج معارف جديدة وتحقيق قيمة جديدة للمؤسسة. بينما لم تلبث نماذج قواعد البيانات الكبيرة أن ظهرت، إلا أننا متفائلون بشأن إمكاناتها التي يمكن استخدامها في إثراء التطبيقات الوكيلة ومساعدة الشركات على تحقيق نتائج أفضل"، مضيفًا أن هذه النماذج جرى تبنيها بالفعل لدمج الذكاء الاصطناعي في عمليات المعاملات.
تخيل، على سبيل المثال، شركة بيع بالتجزئة تبحث عن عملاء يتشابه متوسط قدرتهم الشرائية وسجل شرائهم مع متسوقة تُدعى Claire، التي جاءت مؤخرًا إلى المتجر وأبدت اهتمامًا شديدًا بمنتج جديد من منتجات التجميل. عادةً، كان عالم البيانات في شركة البيع بالتجزئة يبدأ بتحديد المسار—وهي العمليات التي تهدف إلى تحويل البيانات غير المنسقة إلى إجابات مفيدة عن السؤال التجاري المحدد قيد النظر. وبعد ذلك، يصوغ استعلام قاعدة البيانات بمصطلحات محددة للغاية، مثل "ابحث عن جميع العملاء الذين تتراوح أعمارهم بين 20 و40 عامًا ويعيشون في نيويورك وأنفقوا ما لا يقل عن 1000 دولار أمريكي على منتجات التجميل العام الماضي".
ثم يستخرج عالم البيانات البيانات اللازمة، ويحملها على منصة أخرى، وخلال أسابيع أو شهور، يتمكن من تحديد العملاء الذين يشبهون Claire في قاعدة بياناتهم.
ونظرًا إلى العملية الواسعة التي يتضمنها استكمال استعلامات قواعد البيانات التقليدية، تقول Catherine Wu، مديرة برنامج Db2 في Silicon Valley Lab التابع لشركة IBM، في حديثها في IBM Think: "توجد الكثير من البيانات الموجودة على أجهزة الكمبيوتر المركزية للشركات والتي لا تكون عادةً هدفًا للذكاء الاصطناعي التوليدي ولا تحصل الشركات على أي معارف منها".
ويعود ذلك جزئيًا إلى التكلفة والمخاوف الأمنية المرتبطة بنقل البيانات إلى بيئة خارجية. تقول Wu: "لدينا عملاء يخبروننا أن عملية نقل البيانات فقط تشكل 30-40% من نفقات تكنولوجيا المعلومات. وأيضًا، بمجرد نقل البيانات من الكمبيوتر المركزي، لا يمكنهم تتبع وجهتها، وهذا يشكل مصدر قلق كبير للعملاء."
أما نماذج قواعد البيانات الكبيرة تتيح للمستخدمين إمكانية البحث في قواعد البيانات والحصول على إجابات بشكل أسرع وأسهل بكثير، سواء كانت قاعدة البيانات في بيئة محلية أو على السحابة أو هجينة بين الاثنين. لذا يمكن لشركة البيع التجزئة في المثال أعلاه الاستعلام ببساطة في قاعدة البيانات بسؤال: "ضع قائمة بأبرز 100 عميل مثل Claire". وبعد وقت قصير، يمكن لأي شخص مدرب تدريبًا أساسيًا على لغة SQL استخراج تلك المعلومات من دون الحاجة إلى نقل البيانات إلى أي مكان، كما تقول Wu. طرحت IBM أول منتج لقواعد البيانات باستخدام نموذج قاعدة بيانات كبير في عام 2022 يسمى SQL Data Insights (SQL DI)، وهو جزء من قاعدة بيانات Db2 لنظام z/OS على أجهزة الكمبيوتر المركزية IBM Z، والتي تدعم أكثر من 70% من المعاملات المالية العالمية من حيث القيمة.
وكما قالت Kate Soule، مديرة إدارة المنتجات التقنية في Granite، في حلقة حديثة من بودكاست Mixture of Experts، يمكن أن تكون النماذج اللغوية الكبرى "مبالغًا فيها في كثير من الأحيان".
يقول Lewis من IBM: "يمكن تحقيق متطلبات التدريب والضبط الخاصة بنماذج قواعد البيانات الكبيرة باستخدام بنية تحتية مختلفة عن بنية النماذج اللغوية الكبرى. لست بحاجة إلى مجموعة ضخمة من وحدات معالجة الرسومات (GPUs) لمعالجة المشكلات التي تحاول معظم الشركات حلها. وبالمقارنة مع جميع البيانات التي يمكن استخدامها لتدريب النماذج اللغوية الكبرى، فإن قاعدة البيانات المؤسسية الخاصة بالمعاملات تكون صغيرة نسبيًا." ولكن يقول Lewis، يمكن للبيانات الخاصة بالشركات أن تُنشئ "نماذج خاصة لتقديم نتيجة محددة بكفاءة أكبر من حيث التكلفة، وفي كثير من الأحيان بفعالية أكثر".
بفضل SQL DI من IBM، تتحول كل قيمة داخل عمود قاعدة البيانات، بغض النظر عن نوع البيانات، إلى رمز نصي مميز. تقول المهندسة البارزة في شركة IBM، Akiko Hoshikawa: "ومن ثَم، يتعامل النموذج مع كل سجل قاعدة بيانات على أنه Bag of words تشبه جملة باللغة الإنجليزية حيث يحافظ كل رمز مميز على علاقة متساوية مع الآخرين، بغض النظر عن موقعه في السجل". بعد ذلك، يستنتج SQL DI قيم قاعدة البيانات المهمة بناءً على قيم الأعمدة المحيطة، سواء داخل الصف نفسه أو عبر صفوف الجدول. ومن خلال تدريب النموذج بهذه الطريقة، يمكن لأي شخص تقريبًا إجراء استعلام مدعوم بالذكاء الاصطناعي على البيانات العلائقية لاكتشاف ومطابقة البيانات المتشابهة دلاليًا مباشرة داخل قاعدة البيانات.
بينما تستكشف العديد من الشركات نماذج قواعد البيانات الكبيرة كإثبات للمفهوم، تستخدم بعض المؤسسات في مجالات التأمين والبيع بالتجزئة هذه الأدوات بالفعل لتسريع عملية استخراج القيمة من قواعد بياناتها.
يستخدم Thomas Baumann، المروج التقني للبيانات في شركة Swiss Mobiliar، أقدم شركة تأمين في سويسرا، SQL DI من IBM في عدة مجالات عبر الشركة. بدأ Baumann باستخدام SQL DI لمساعدة الشركة على تصميم عروض أسعار التأمين على السيارات بشكل أفضل بهدف زيادة المبيعات. عند تفاعل أحد مندوبي المبيعات مع حامل بوليصة تأمين جديد محتمل، يمكنه إدخال سعر، وسيستخرج نموذج قواعد البيانات الكبيرة الحالات السابقة الأكثر تشابهًا لتحديد احتمالية قبول العميل للسعر.
يقول Baumann في مقابلة مع IBM Think: "بعد ذلك، يمكن للمستخدم تغيير بعض المعلمات، مثل تقليل الخصومات أو تقديم خصم أكبر، ثم يعيد حساب الاحتمالات الجديدة لمعرفة مدى احتمالية النجاح. لقد أصبحت عروض الأسعار أكثر تطورًا وتخصيصًا للعملاء الأفراد أكثر من أي وقت مضى".
باستخدام SQL DI من IBM لمنتج تأمين السيارات من Swiss Mobiliar، دربت الشركة النموذج باستخدام حوالي 15 مليون سجل لبيانات عروض أسعار تأمين السيارات، حيث يحتوي كل سجل على عدة عشرات من السمات لكل سجل، مثل البيانات الديموغرافية وبيانات السيارة والسعر. يقول Baumann إن موظفي المبيعات وجدوا أن بإمكانهم تقديم عروض أسعار أكثر علمية من خلال التحقق من مختلف احتمالات عروض الأسعار المقترحة قبل اختيار واحد منها.
ونتيجة لذلك، حسنوا معدل إتمام صفقات مبيعات التأمين بنسبة 7% خلال ستة أشهر—وهو تحسن يقول Baumann إنه كان سيستغرق حوالي عامين من دون استخدام نماذج قواعد البيانات الكبيرة. وبناءً على نجاح هذه التجربة، تستخدم Swiss Mobiliar الآن نماذج قواعد البيانات الكبيرة لجميع منتجاتها التأمينية (باستثناء التأمين على الحياة)، بدءًا من التأمين على المباني وحتى التأمين على المنازل.
يقول Baumann: "أهم ميزتين من مزايا SQL DI هما أنه سريع جدًا في تحويل الأفكار إلى مرحلة ما قبل الإنتاج. كما أنك لست بحاجة إلى نقل البيانات من منصة إلى أخرى."
وإلى جانب قطاع التأمين، يعمل فريق SQL DI من IBM أيضًا مع العديد من تجار التجزئة للمواد الغذائية في الولايات المتحدة وأوروبا المهتمين باستخدام نماذج قواعد البيانات الكبيرة لتزويد العملاء بتجارب تسوق أكثر تخصيصًا. على سبيل المثال، يمكن للعميل أن يحمل نوعًا واحدًا من الحبوب في يده ويُجري استعلامًا دلاليًا في قاعدة البيانات للبحث عن حبوب بديلة لها مذاق مشابه ولكنها ذات مكونات غذائية أكثر صحة. تقول Hoshikawa إن نماذج قواعد البيانات الكبيرة المستخدمة لتقديم اقتراحات تشبه "توصيات Amazon أو Netflix الأكثر تطورًا وتخصيصًا".
وبالإضافة إلى التطبيقات الموجهة للعملاء، تنشر الشركات بالفعل نماذج قواعد البيانات الكبيرة في العديد من مجالات التعاملات بين الشركات، مثل اكتشاف الحالات الشاذة والكشف عن الغش في الوقت الفعلي. أي شركة تُصدر عقودًا، على سبيل المثال، يمكنها استخدام نموذج قاعدة بيانات كبير لتحديد العقود غير العادية بسرعة، كما تقول Hoshikawa من IBM.
وفي الوقت نفسه، يمكن لنماذج قواعد البيانات الكبيرة دعم الكشف عن الغش الأكثر تطورًا في الوقت الفعلي أيضًا. وبالإضافة إلى تحديد المعاملات التي لا تتبع الأنماط التقليدية، يمكن لنماذج قواعد البيانات الكبيرة إجراء استعلام في قواعد البيانات لتحديد السجلات التي تتضمن سمات مختلفة مرتبطة بالسلوك المشبوه، مثل الشركات التي تفتقد تقارير Better Business Bureau أو تفتقر إلى عناوين فعلية.
يعتقد Lewis أن النماذج اللغوية الكبرى ونماذج قواعد البيانات الكبيرة ستتبعها العديد من النماذج المتخصصة الأخرى. يقول: "نحن نؤمن أن نماذج قواعد البيانات الكبيرة، على غرار النماذج اللغوية الكبرى، هي أداة قيمة لتمكين موجة من التطبيقات الوكيلة والمساعدة على تحقيق نتائج أفضل. لكننا لا نتوقع استخدامها دائمًا بمعزل عن غيرها. في الواقع، نعتقد أن السيناريو المثالي هو دمج نماذج قواعد البيانات الكبيرة في نموذج بيانات مؤسسية ثم دمجها مع نماذج لغوية كبرى وغيرها من النماذج المناسبة للغرض من أجل تحقيق قيمة جديدة هائلة على نطاق واسع للمؤسسات والمجتمع."
وبالمثل، لا يتوقع Lewis أن تهيمن شركة أو مؤسسة واحدة بالضرورة. يقول Lewis: "لا تظن أنها ستكون شركة واحدة، أو الشركة التي تمتلك أكبر عدد من الخوادم وأكبر عدد من وحدات معالجة الرسومات هي التي ستعمل على تطوير نماذج Swiss Army Knife. أنا لا أظن ذلك. ومثلما أعتقد أننا يمكن أن نكسب أكبر قدر من المعارف من خلال الاستفادة من المعرفة المتخصصة للخبراء المتخصصين في مجالات مختلفة، فإنني أعتقد أن إمكانية دمج النماذج اللغوية الكبرى ونماذج قواعد البيانات الكبيرة وموجات المستقبل من النماذج المصممة خصوصًا ستؤدي إلى معارف جديدة ونتائج حقيقية محسنة حقًا."
استخدم حلول قاعدة بيانات IBM لتلبية احتياجات أحمال التشغيل المتنوعة عبر السحابة الهجينة.
اكتشف، IBM Db2، وهي قاعدة بيانات علائقية توفر مستوى عالٍ من الأداء وقابلية التوسع والموثوقية لتخزين وإدارة البيانات المنظمة. وتتوفر كنظام SaaS على IBM Cloud أو للاستضافة الذاتية.
استفِد من قيمة بيانات المؤسسة مع IBM Consulting لبناء مؤسسة تعتمد على الرؤى لتحقيق ميزة تنافسية في الأعمال.