يعد الذكاء الاصطناعي الوكيل قوة تحويلية، حيث تتوقع Gartner أن ثلث تفاعلات الذكاء الاصطناعي التوليدي ستستخدم نماذج العمل والوكلاء المستقلين بحلول عام 2028.
ولكن يمكن لوكلاء الذكاء الاصطناعي غير الخاضعين للإشراف أن يعملوا باستقلالية وقوة كبيرتين، مما يعرض المؤسسات للعديد من المخاطر غير المتوقعة التي قد تؤدي إلى تأثير ضار وغير قابل للإصلاح على كل من الشركات والعملاء. يمكن لعمليات صناعة القرار المعقدة التي تتأثر بالبيانات أن تخلق تحيزات وتعقّد إمكانية التتبع وتثير مخاوف أمنية. وهناك اختيارات غير صحيحة وهلوسة في الذكاء الاصطناعي، تزيدان من تعقيد هذه التحديات.
ولمواجهة هذه التحديات، أعلنا في شهر مارس عن المعاينة التقنية لقدرات حوكمة الذكاء الاصطناعي الوكيل. بناءً على هذا التطور، نقوم بطرح ميزات جديدة إضافية كجزء من watsonx.governance.
كتالوج الوكلاء المحكومين هو مَورد شامل للموارد لإدارة واختيار أدوات الذكاء الاصطناعي والوكلاء وسير العمل، مصمم لتبسيط اختيار الأدوات/الوكلاء وتعزيز إعادة الاستخدام عبر المستخدمين وحالات الاستخدام. حيث يساعد هذا المستودع المركزي الفرق في الحفاظ على الاتساق والكفاءة من خلال دمج مجموعة واسعة من الأدوات، كل منها يؤدي مهام محددة ضرورية لتصميم وبناء الأنظمة الوكيلة. تشمل هذه الأدوات الوكيلة وظائف مختلفة، مثل استرجاع البيانات والاتصالات الخارجية.
تتضمن السمة الرئيسية للكتالوج ما يلي:
من خلال الاستفادة من كتالوج الوكيل المنظم، يمكن للفرق إدارة امتداد الأدوات وضمان الاستخدام المناسب للأداة والحفاظ على الاتساق عبر الأقسام. حيث يؤدي هذا النهج الشامل لإدارة الأدوات في نهاية المطاف إلى تسريع التقدم وتعزيز بيئة تعاونية لتطوير النظام الوكيل.
أدى الانتشار المتزايد لوكلاء الذكاء الاصطناعي إلى ظهور تعقيدات كبيرة، مثل التحدي المتمثل في تقييم الأداء والموثوقية والسلامة والسلوك الأخلاقي لوكلاء الذكاء الاصطناعي المستقلة.
يمكن أن تقلل أفضل ممارسات تقييم الذكاء الاصطناعي الوكيل من التعرض لمختلف المخاطر التي يمكن التنبؤ بها وغير المعروفة. ومع ذلك، يمكن أن يمثل تتبع الأداء تحديًا للمؤسسات والمطورين، حيث لا يتطلب الوكلاء مراقبة المخرجات فحسب، بل أيضًا السلوكيات والقرارات والنوايا. باستخدام watsonx.governance، يمكن للمؤسسات تقييم أداء الوكيل باستخدام:
ابتداءً من مارس، قدم موقع watsonx.governance هذه القدرات الجديدة لدعم مقاييس متخصصة إضافية. أصبحت مقاييس الذكاء الاصطناعي الوكيل الجديدة ذات التوليد المعزز بالاسترجاع متاحة الآن. تتضمن المجموعة الشاملة من المقاييس لتقييم الأداء، بما في ذلك HAP، وPII، وموجِّه الحقن، وملاءمة السياق، والإخلاص، وتشابه الإجابة، وملاءمة الإجابة، ومعدل الإصابة، ومتوسط الدقة، والرتبة المتبادلة، والطلبات غير الناجحة، وغيرها، لضمان إجراء تقييم شامل لمدى فاعلية نظامنا. وذلك يساعد على تأكيد تصرف الوكلاء بشكل مناسب ويكشف علامات التحذير من خلال إضافة حواجز الحماية اللازمة لتنظيم سلوك الوكيل نحو النتيجة المرجوة.
ستكون هذه المقاييس متاحة عن طريق إضافة وظيفة تزيين بسيطة في python إلى عقدة الأداة في التطبيق LangGraph. ستؤدي إضافة وظيفة التزيين هذه إلى حساب المقياس كمنتج ثانوي لتشغيل العقدة في التطبيق. ثم يمكن بعد ذلك استخدام المقياس المحسوب داخل التطبيق لاتخاذ قرارات التدفق. على سبيل المثال، إذا كان السياق الذي تم جلبه من قاعدة بيانات المتجهات غير ذي صلة باستعلام المستخدم، فلا تقم بإنشاء إجابة، بل حاول البحث على الويب لجلب السياق الصحيح. وهذه المقيِّمات ليست سهلة الاستخدام فحسب، بل إنها فعالة أيضًا وتتضمن مقاييس مفتوحة المصدر ومقاييس متقدمة من شركة IBM. وبالتالي، فهي توفر مجموعة كبيرة من القدرات للتقييم ومناسبة لمختلف حالات الاستخدام وأنواع المهام.
يعد تتبع التجارب أمرًا بالغ الأهمية في إدارة وكيل الذكاء الاصطناعي لأنه يوفر سجلًا شاملًا لجميع التغييرات والتكرارات والتحسينات التي تم إجراؤها أثناء عملية التطوير. ويشمل ذلك تعديلات على الخوارزميات وإدخال البيانات والمعلمات الفائقة والجوانب الحساسة الأخرى.
يعد تطوير التطبيقات الوكيلة عملية تكرارية. حيث يقوم المطورون ببناء تطبيق الذكاء الاصطناعي الوكيل واختباره وضبطه الدقيق عند الضرورة وبناء نسخة جديدة لتحسين المخرجات، وتستمر العملية لمزيد من التحسين. سيدعم Watsonx.governance تلقائيًا تتبع التجارب المختلفة والمقارنة باستخدام Evaluation Studio:
يعمل نظام watsonx.governance على تسريع عملية التكرار والتطوير من خلال تمكين إجراء مقارنات سريعة لتطبيقات الذكاء الاصطناعي الوكيل. ولا تقتصر هذه الوظيفة على تطبيقات الذكاء الاصطناعي المبنية على منصة watsonx الخاصة بنا، بل إنها توسع نطاق الدعم ليشمل منصات الطرف الثالث، مما يوفر تنوعًا في الاستخدامات.
يمكن أن تساعد المقاييس في تتبع الأداء، ويكشف مشكلات مثل تدهور الأداء وانحراف البيانات وانحراف النموذج في الإنتاج، وتوجيه التحسينات. فبدون التقييم المناسب، يصبح من الصعب الوثوق بعميل الذكاء الاصطناعي أو التحكم فيه أو ضبطه بدقة لتحسين دقته، مما يزيد من مخاطر النتائج غير المقصودة.
في السيناريوهات التي يتم فيها نشر الذكاء الاصطناعي الوكيل في الإنتاج، تصبح المراقبة المستمرة ضرورية لمعالجة مشكلات مثل الهلوسة وتأخر وقت الاستجابة وانحراف النموذج والتحيز. كما يعد نشر تطبيقات الذكاء الاصطناعي الوكيل مع المراقبة المستمرة للإنتاج أمرًا حساسًا للحفاظ على موثوقية النظام والثقة به. وتتيح المراقبة في الوقت الحقيقي لفرق MLOPS وAgentOps تتبع سلوك النموذج والوكيل وانحراف الأداء والمخرجات غير المتوقعة، مما يسمح بالتدخل الفوري عند حدوث انحرافات. وهذا الاستعداد التشغيلي يضمن أن تظل الأنظمة المستقلة متوافقة مع الأهداف المرجوة وقيود السلامة.
في الإصدارات القادمة، سيتم تجهيز watsonx.governance من شركة IBM لتقديم رقابة مستمرة على التطبيقات، حيث سيبدأ التنبيهات عند تجاوز أي من المقاييس حدودها المحددة مسبقًا. حيث تضمن هذه الميزة الإدارة الاستباقية والتدخل في الوقت المناسب للحفاظ على الأداء الأمثل لنظام الذكاء الاصطناعي.
وعلى غرار التقنيات الأخرى سريعة التطور، فإن وكلاء الذكاء الاصطناعي يطرحون مخاطر وعقبات وعواقب مجتمعية محتملة. ومن بعض المخاطر الجديدة التي ظهرت مع ظهور وكلاء الذكاء الاصطناعي التحيز في البيانات، والإجراءات الزائدة عن الحاجة، والهلوسة، ومشاركة المعلومات السرية، والهجمات على الموارد لوكيل الذكاء الاصطناعي. علاوة على ذلك، يكثف الذكاء الاصطناعي الوكيل المخاطر والتحديات والآثار المجتمعية الحالية.
يوفر IBM® Risk Atlas قائمة بالمخاطر المتأصلة في البيانات والذكاء الاصطناعي ويتم تحديثه ليعكس المخاطر والتهديدات الوكيلية.
هناك حاجة إلى حوكمة الذكاء الاصطناعي في جميع مراحل دورة حياة الذكاء الاصطناعي، بدءًا من إنشاء حالة الاستخدام والتطوير والتحقق من صحتها إلى المراقبة في الإنتاج. وفي كل مرحلة، هناك مخاطر ومزالق، والتي إذا لم تتم إدارتها بشكل صحيح، يمكن أن تسبب مشاكل حالية أو مستقبلية. على سبيل المثال، أثناء إنشاء حالة استخدام جديدة، يوفر موقع watsonx.governance تقييمًا، مما يساعدك على تحديد المخاطر التي تكون حالة الاستخدام الخاصة بك عرضة لها حتى تتمكن من دمج تقنيات إدارة المخاطر اللازمة. وبالمثل، أثناء تطوير تطبيق وكيلي، تحتاج إلى قياس وتقييم أداء كل أداة أو عقدة في التطبيق لإجراء تحسينات في التكرارات المستقبلية.
توفر Watsonx.governance مكتبة تحتوي على أكثر من 50 مقياسًا يمكن إضافتها كوظائف تزيين إلى التطبيق وقياس الأداء. من دون حوكمة، لن تتمكن من التوسّع أو بناء الثقة في تقنيات الذكاء الاصطناعي لديك.
لا غنى عن الحوكمة الفعالة والتأكد من الجانب الأمني، لكن مع نمو الشركات واعتمادها للذكاء الاصطناعي على نطاق واسع، يصبح تنفيذ هيكل حوكمة قوي للذكاء الاصطناعي أمرًا ضروريًا لضمان إجراء التجارب الآمنة وإدارة تعقيدات اعتماد الذكاء الاصطناعي على نطاق واسع بكفاءة.
جرّب watsonx.governance لاستكشاف هذه الإصدارات الجديدة من الميزات والعديد من التحسينات الأخرى المصممة لمساعدة الشركات على إطلاق القدرات الحقيقية للذكاء الاصطناعي وتحويل تجربة حوكمة الذكاء الاصطناعي اليوم.
جرّب watsonx.governance مجانًا اليوم
تعرف على كيفية العمل باستخدام أدوات حوكمة الذكاء الاصطناعي الحديثة