72% من الرؤساء التنفيذيين المتميزين يتفقون على أن امتلاك أكثر أدوات الذكاء الاصطناعي التوليدي تقدماً يمنح المؤسسة ميزة تنافسية، وفقاً لمعهد IBM لقيمة الأعمال. ولكن إذا لم تكن أدوات الذكاء الاصطناعي التوليدي مبنية على سياق المؤسسة الفريد، فقد لا تستفيد المؤسسات منها بالكامل.
على الرغم من قوة نماذج الذكاء الاصطناعي التوليدي الكبيرة والعامة مثل ChatGPT وGoogle Gemini، إلا أنها ليست مدربة على مجموعات بيانات خاصة بالمؤسسات. عندما يتم توصيلها بعمليات المؤسسة، قد تغيب عنها معلومات مهمة قد تتسبب في إرباكهم وتحقيق نتائج دون المستوى الأمثل.
“كل شركة لديها لغتها الخاصة،” يوضح Michael Choie، مستشار الإدارة الأول في قسم الذكاء الاصطناعي والتحليلات في شركة IBM Consulting. “خذ كلمة (عين). بالنسبة إلى الزراعة، فهذا يعني “بئر الماء”. بالنسبة إلى التشريح الطبي، يعني ذلك “عين الإنسان”.
تعاونت IBM مع The Harris Poll لنشر AI in Action 2024، وهو استطلاع شمل 2000 مؤسسة حول العالم. اكتشف الاستطلاع أن 15% من هذه المؤسسات—المعروفة باسم قادة الذكاء الاصطناعي—تحقق النتائج القابلة للقياس باستخدام الذكاء الاصطناعي.
أحد الأمور التي تميز قادة الذكاء الاصطناعي هو الثقة في قدرتهم على تخصيص جهود الذكاء الاصطناعي لتحقيق أفضل قيمة. هذا لا يعني أنه يجب على المؤسسة أن تبني نماذجها الخاصة من الصفر لتتميز عن الآخرين. بدلاً من ذلك، يمكنها تكييف نماذج الذكاء الاصطناعي الحالية من خلال الاستفادة من الشيء الوحيد الذي لا يملكه أحد غيرها: بيانات المؤسسات الخاصة المملوكة لها.
"كل بائع ذكاء اصطناعي، مثل X أو Google، لديه إمكانية الوصول إلى المعلومات العامة. كما أن لديهم إمكانية الوصول إلى البيانات من منصاتهم الخاصة،" يشرح Shobhit Varshney، نائب الرئيس والشريك الأول، قائد الذكاء الاصطناعي في الأمريكتين في شركة IBM Consulting. "ما لا يستطيعون الوصول إليه هو بيانات مؤسستك. قطعة الأحجية هذه مفقودة ".
كما يوضح Varshney في AI in Action 2024: "الحدود التالية هي جعل الذكاء الاصطناعي يعبر الهوة ويدخل داخل المؤسسة ليتمكن من الامتصاص والتعلم لكي يصبح ميزتك التنافسية."
هناك ثلاث طرق رئيسية لتغذية البيانات الخاصة في نماذج الذكاء الاصطناعي: الموجِّه، التوليد المعزز بالاسترجاع (RAG)، والضبط الدقيق.
في هذا السياق، تعني هندسة الموجّه تضمين بيانات خاصة في الموجّه الذي يمرر إلى الذكاء الاصطناعي.
لنفترض أن المستخدم يريد نموذج ذكاء اصطناعي لتلخيص محادثات مركز الاتصالات. يمكن للمستخدم كتابة موجِّه - "تلخيص هذه المحادثة" - وإرفاق نص المكالمة كجزء من الموجِّه.
لا تتطلب هندسة الموجِّه تغيير النموذج نفسه. وهي الأنسب للمهام ذات الحجم المنخفض والعامة حيث يكون من المعقول تضمين السياق الضروري في كل موجّه.
التوليد المعزز بالاسترجاع (RAG) يعني ربط نموذج الذكاء الاصطناعي بقاعدة بيانات خاصة. يمكن للنموذج سحب المعلومات ذات الصلة من قاعدة البيانات هذه عند الاستجابة للموجِّه.
على سبيل المثال، يمكن لمؤسسة أن تمنح روبوت محادثة لخدمة العملاء وصولاً إلى قاعدة بيانات لمنتجات الشركة. عندما يطرح المستخدمون أسئلة على روبوت المحادثة حول هذه المنتجات، يمكنه الاطلاع على الوثائق المقابلة والحصول على الإجابة الصحيحة.
لا يتطلب التوليد المعزز للاسترجاع (RAG) أي تغييرات دائمة في النموذج. يمكن أن يحسّن الدقة ويقلّل من الهلوسة، ولكنه يمكن أن يزيد أيضاً من أوقات الاستجابة.
الضبط الدقيق يعني إعطاء نموذج من نماذج الذكاء الاصطناعي بيانات إضافية كافية لتغيير بعض معاييره. يؤدي الضبط الدقيق إلى تغيير سلوك النموذج بشكل دائم، وتكييفه مع حالة استخدام أو سياق معين. كما أنها أسرع وأرخص من تدريب نموذج جديد تمامًا.
"إذا كان لديك شبكة عصبية تحتوي على مائة طبقة مختلفة، فإن التدريب يعني أنك تعدل جميع الطبقات المائة،" يوضح Choie. "يعني الضبط الدقيق أنك تغير بالفعل الطبقات القليلة الماضية. ما زلت تعدل النموذج، ولكن ليس عليك تغييره بالكامل لأنه يعمل بالفعل بشكل جيد".
يتطلب الضبط الدقيق استثمارًا مقدمًا أكثر بقليل من الهندسة السريعة و التوليد المعزّز بالاسترجاع (RAG). من المفيد تحويل نموذج أصغر إلى خبير في مجال متخصص. على سبيل المثال، يمكن لشركة التأمين الضبط الدقيق لنموذج ليتقن فن معالجة المطالبات الجديدة.
يشبه Varshney النموذج الذي تم ضبطه بدقة بموظف جديد مدرب بشكل مكثف حديث التخرج من المدرسة. قد لا يمتلك ذلك الخريج سعة المعرفة التي يمتلكها العالم العبقري متعدد المهارات (أو نموذج الذكاء الاصطناعي متعدد المهارات الكبير متعدد الأغراض)، لكنه أفضل بكثير في معالجة المطالبات من العالم متعدد المهارات.
يقول Varshney: "لا يمكنه أن يقوم بحساب ضرائبك أو كتابة عقد قانوني"، "ولكن إذا طلبت منه معالجة مطالبة، فسيعرف كيف يفعل ذلك على الفور."
يمكن أن يوفر استخدام البيانات الخاصة بهذه الطرق ميزة تنافسية كبيرة من خلال تعريف نماذج الذكاء الاصطناعي بالعمليات الفريدة للمؤسسة ومنتجاتها وعملائها والفروق الدقيقة الأخرى.
يقول Choie: "إذا كان لديك ذكاء اصطناعي يكون مستخدموه الرئيسيون من مؤسسة معينة، فمن المهم أن يستخدم الذكاء الاصطناعي بيانات من نفس المؤسسة".
عندما يكون لدى نماذج الذكاء الاصطناعي إمكانية الوصول إلى البيانات الخاصة، فإنها ترتكز على سياق عمل محدد، مما يعني أن مخرجاتها ترتكز أيضًا على هذا السياق.
يقول Varshney، "يمكنني أخذ نموذج الذكاء الاصطناعي المفتوح، وضبطه بدقة باستخدام بياناتي الخاصة، وهذه النسخة ملكي بشكل فريد". "أنا أملك الملكية الفكرية وراء ذلك. فأنا أشغله على بنيتي التحتية ".
ونتيجة لذلك، يمكن أن تنتج هذه النماذج مخرجات أكثر دقة وفعالية من النماذج الجاهزة غير المعدلة التي يتم سحبها من مجموعة عامة من البيانات العامة.
يمكن للمؤسسات استخدام العديد من أنواع نماذج الذكاء الاصطناعي المختلفة لتحقيق النتائج. لكن النماذج مفتوحة المصدر —مثل نماذج IBM Granite، المتوفرة بموجب ترخيص Apache 2.0 للاستخدام التجاري الواسع وغير المقيد — تقدم بعض الفوائد.
"عند تدريب نموذج الذكاء الاصطناعي، هناك العديد من المعايير والتقنيات المختلفة التي تحتاج إلى تعديلها لضمان تعلم نماذج الذكاء الاصطناعي بفعالية وكفاءة. تحتاج إلى علماء بيانات متخصصين وخبراء تعلم الآلة لإعداد ذلك،" يشرح Choie. "فائدة ضبط النماذج المفتوحة بدقة هي أننا نمتلك هذه النماذج التي قام بعض الأشخاص العباقرة بالحصول عليها بالفعل. كل ما نحتاج إليه هو تغذية النماذج ببيانات إضافية خاصة بمهام محددة وتعديل بضع طبقات، وهي مهمة أبسط بكثير من بناء نموذج ".
فبالإضافة إلى السماح للمؤسسات بالاستفادة من حكمة الجمهور، يمكن للنماذج مفتوحة المصدر أن تمكّن المؤسسات من التجريب دون أن تكون تكلفة الفشل باهظة للغاية. يساعد هذا التجريب بدوره المؤسسات على اتباع استراتيجية متعددة النماذج، باستخدام العديد من النماذج المختلفة - والمضبوطة بشكل مختلف - للمهام الخاصة بالمجال.
تعتبر هذه الاستراتيجية متعددة النماذج من أفضل الممارسات. وجد AI in Action 2024 أن 62% من قادة الذكاء الاصطناعي يستخدمون نماذج متعددة، مقارنة بنسبة 32% من متعلمي الذكاء الاصطناعي.
يقول Choie: "من البديهي تقريبًا استخدام نماذج مفتوحة المصدر". "إنها فعّالة من حيث التكلفة، ولديك بعض من أفضل الأشخاص في المجال يعملون عليها، وكلما كانت هناك تحديثات أو مشاكل، يعمل المجتمع على حلها معاً."
إدارة البيانات الفعالة هي واحدة من الخصائص الرئيسية التي تميز قادة الذكاء الاصطناعي عن المنظمات الأخرى، وفقاً لتقرير AI in Action 2024. يؤمن 61% من قادة الذكاء الاصطناعي بقدرتهم على الوصول إلى بيانات المنظمة وإدارتها بفعالية لدعم مبادرات الذكاء الاصطناعي، مقابل 11% من المتعلمين في الذكاء الاصطناعي.
ولكن تغذية نماذج الذكاء الاصطناعي بالبيانات الخاصة ليست بالبساطة التي تبدو عليها. يمكن أن تشكل صوامع البيانات ومراقبة الجودة وقضايا أخرى عائقًا.
بشكل عام، الحل هو تنفيذ نسيج بيانات متكامل يهدم الحواجز، ويضمن التوافق، وينسق حركة البيانات السلسة عبر المنصات.
ولكن كيف يبدو ذلك عند تطبيقه عمليًا؟ فيما يلي بعض الاعتبارات الرئيسية:
العقبات الأولى أمام العديد من جهود الذكاء الاصطناعي هي جمع وتخزين البيانات، وهي عمليات ليست بسيطة كما قد تبدو.
غالبًا ما يؤدي جمع البيانات في قواعد البيانات التقليدية إلى صوامع البيانات، مما قد يمنع المؤسسة من تجميع كل البيانات التي تحتاجها لبناء قاعدة بيانات فعالة أو الضبط الدقيق. وفقا لمؤشر IBM Data Differentiator، فإن 82% من المؤسسات تعاني من انعزال البيانات مما يعيق سير العمل الرئيسي لديها.
تحتاج المؤسسات إلى تنفيذ مسار لاسترجاع البيانات من مصادر مختلفة، وإعدادها للاستخدام وإيداعها في مخزن مركزي يسهل الوصول إليه.
قد يتطلب استرجاع وتحضير البيانات استخدام أدوات معالجة التدفق، مثل Apache Kafka، أو أدوات تكامل البيانات الجاهزة لـ ETL وELT، مثل IBM DataStage. يجب على المؤسسات أيضًا اختيار المستودعات المناسبة للبيانات، والتي يمكن أن تشمل:
بحيرة البيانات، التي توفر بيئات تخزين منخفضة التكلفة مصممة للتعامل مع كميات هائلة من البيانات الخام المنسقة وغير المنسقة.
مستودعات البيانات، التي تم بناؤها لدعم جهود تحليلات البيانات وذكاء الأعمال وعلم البيانات.
مستودعات بحيرة البيانات، مثل watsonx.data، والتي تدمج قدرات المستودعات والبحيرات في حل إدارة بيانات واحد.
تُعد البنية التحتية السحابية الهجينة أيضاً عنصراً مهماً في جهود تكامل البيانات. العديد من المؤسسات اليوم لديها بيانات موزعة بين مخازن البيانات المحلية والخدمات السحابية المتعددة.
"عليك التأكد من قدرتك على جمع كل هذه المعلومات، بغض النظر عن مكانها، وإدخالها في نماذج الذكاء الاصطناعي الخاصة بك،" يقول Choie. "إذا لم تكن تستخدم أداءً هجينًا، فستفقد شيئًا ما."
الإدخالات السيئة تؤدي إلى مخرجات سيئة. تحتاج المؤسسات إلى التأكد من أن البيانات الخاصة التي تزود نماذج الذكاء الاصطناعي بها موثوقة ودقيقة.
يقول Varshney: "تحتاج إلى اكتشاف العنصر الذهبي في بياناتك — ما يميز بياناتك — حتى تتمكن من تعزيز ذلك. "ينبغي عليك تقليل الضوضاء في البيانات، وتوفير بيانات عالية الجودة لضبطها بدقة."
يجب تنظيف البيانات قبل إرسالها إلى الذكاء الاصطناعي. وإلا فقد يؤدي ذلك إلى أن يصبح أداء النموذج أسوأ.
يقدم Varshney مثالاً على تذكرة مركز اتصال مع حل غير واضح بشكل كامل: "قد يجرب الأشخاص خمس طرق مختلفة لإصلاحها قبل أن يجدوا الطريقة التي تنجح. لا يمكنك إرسال تلك التذكرة مباشرةً إلى النموذج. سيكون صاخباً جداً. سوف يحتوي على كل الأشياء التي جربها الناس. قد يرتبك النموذج بشأن النتيجة الصحيحة. إنك تريد تنظيف الضوضاء حتى يرى النموذج الحل الحقيقي فقط ".
يتطلب تنظيف وإعداد وتنسيق مجموعات البيانات بعض العمل اليدوي من قبل علماء البيانات والمحللين، سواء من الداخل أو الشركاء الخارجيين. كما يتضمن أدوات مثل:
يمكن لأدوات إدارة البيانات المدعومة بالذكاء الاصطناعي التحقق من صحة البيانات تلقائيًا والإبلاغ عن الأخطاء وتحويل البيانات إلى التنسيق المناسب.
يمكن لمولدات البيانات الاصطناعية أن تساعد في ملء القيم المفقودة وتعزيز الأصول بمجموعات أكبر.
أدوات المعالجة المسبقة للبيانات وهندسة البيانات، مثل Apache Spark ومكتبة Pandas Python.
يمكن لأدوات قابلية ملاحظة البيانات تتبع تدفق البيانات بمرور الوقت، ومراقبة الاستخدام ودورة حياة البيانات، و كشف الحالات الشاذة.
مهما كانت المزايا التنافسية التي يمكن أن تجلبها البيانات الخاصة للذكاء الاصطناعي التوليدي، فإن الميزة الاستراتيجية الدائمة تأتي من تنفيذ المزيج الصحيح من التقنية وعمليات الأعمال.
يوضح Varshney قائلاً: "إن سير العمل في حد ذاته هو المكان الذي توجد فيه الأموال". "النموذج سلعة، وسوف نستمر في الحصول على نماذج أفضل وأفضل. ما نحتاج حقًا إلى اكتشافه هو المزيج الجراحي الصحيح للجمع بين الذكاء الاصطناعي التقليدي والأتمتة والذكاء الاصطناعي التوليدي معًا في سير العمل.
بعبارة أخرى، لا يمكن للمؤسسات إدخال الذكاء الاصطناعي التوليدي—حتى لو كان نموذجا دقيقاً يتناسب مع مواصفاتها—في عملياتها وتتوقع الحصول على نتائج. بل يجب عليها تقييم عملياتها وتكييف مهام سير العمل الخاصة بها مع النماذج بقدر ما يكيفون النماذج مع مهام سير العمل.
فكر في غسالة الأطباق المتواضعة.
يقول Varshney: "عندما طورنا غسالة الأطباق، لم نكن نتوقع منها أن تقف وتغسل بالطريقة التي نتبعها في غسل الصحون". "لقد غيّرنا العملية لتتمكّن غسالة الأطباق من التفوق حقًا في عملية الغسيل. لقد حددنا المشكلة بالتنسيق الصحيح. نحن بحاجة إلى أن نفعل الشيء نفسه هنا. نحتاج إلى إعادة هندسة العمليات وإيجاد المزيج الصحيح بين الذكاء الاصطناعي التقليدي و الذكاء الاصطناعي التوليدي. ثم تبدأ في فتح آفاق القيمة".
