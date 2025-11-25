توسيع نطاق استدلال الذكاء الاصطناعي التوليدي وتحسينه باستخدام IBM AI Optimizer for Z 2.1
يوفر القدرات التي تعمل على تحسين استدلال الذكاء الاصطناعي التوليدي عبر البنى التحتية من خلال التخزين المؤقت للقيمة الرئيسية وإمكانات المراقبة.
تم تصميم AI Optimizer for Z 2.1 لخدمة نماذج الذكاء الاصطناعي وإجراء تحسين الاستدلال على مُسرِّع IBM Spyre. فهو يعمل على تحسين استدلال الذكاء الاصطناعي التوليدي عبر البنى التحتية من خلال قدرات التخزين المؤقت للقيمة الرئيسية (KV) والمراقبة التي تم تكوينها لعملاء IBM Z.
بالنسبة إلى المؤسسات التي تشغِّل أحمال التشغيل على IBM Z، فإن الطريق إلى تشغيل الذكاء الاصطناعي لا يتعلق بما إذا كان بإمكانها تشغيله أم لا، بل يتعلق بمدى كفاءة وأمان دمجه في البيئات الحالية.
تزداد أعباء العمل في الذكاء الاصطناعي وتستهلك موارد أكبر، خاصة مع تطبيقات الذكاء الاصطناعي التوليدي وتطبيقات النماذج اللغوية الكبيرة. في Z، يجب على العملاء تحقيق التوازن بين:
صُمم AI Optimizer for Z 2.1 ليتوافق مع هذه الحقائق، ما يمكّن المؤسسات من اتخاذ قرارات يدوية أقل والأتمتة بذكاء أكبر فيما يتعلق بتوجيه والاستدلالات وتحسينها.
يقدم هذا الإصدار العديد من التحسينات التقنية التي تحسن الأداء والكفاءة على حد سواء:
باستخدام لوحات معلومات Grafana وPrometheus، يوفر AI Optimizer for Z 2.1 مراقبة عميقة ورؤى في الوقت الفعلي تقريبًا لمقاييس أداء الاستدلال واستخدام الأجهزة وSpyre وأنماط استخدام النماذج ويحدد العوائق وأوجه الشذوذ في خدمة النماذج. على سبيل المثال، يمكن للمستخدمين تفسير البيانات المعقدة بشكل بديهي من خلال إحدى لوحات المعلومات، وتجنب الإفراط في التخصيص والتخطيط لاتخاذ قرارات مستقبلية بشأن البنية التحتية والميزانية باستخدام هذه المقاييس.
باستخدام خطة تسليم على مراحل، يمكن تمكين مستويين من التخزين المؤقت لإعادة استخدام العمليات الحسابية المحسوبة مسبقًا لتسلسلات الرموز المميزة الشائعة عبر طلبات الاستدلال المختلفة. المستوى الأول هو تخزين القيمة الرئيسية (KV) مؤقتًا باستخدام نموذج لغوي كبير واحد يُنشر على عدة وحدات أجهزة. سيتم تسريع طلبات الاستدلال التي تحتوي على نصوص مخزنة مؤقتًا ويمكن تحسين استخدام الأجهزة. والمستوى الثاني هو مشاركة التخزين المؤقت عبر عدة عمليات نشر للنماذج اللغوية الكبيرة، ما يسرع الاستدلال ويقلل من الوقت اللازم للوصول إلى الرمز المميز الأول ويزيد من معدل النقل.
يمكن اكتشاف النماذج اللغوية الكبيرة التي تعمل على Spyre تلقائيًا بواسطة AI Optimizer for Z وتسجيلها لتحسين الاستدلال. يمكن للمستخدمين إنشاء خطط توجيه مخصصة حيث يأخذ جهاز التوجيه الذكي المدمج في الحسبان التوافر والاستخدام والأداء. يمكن تجميع أدوات النماذج اللغوية الكبيرة التي تخدم تطبيقات أو أغراضًا متشابهة معًا عن طريق إضافة علامات عليها. كما يمكن للمستخدمين تكوين العلامات الخاصة بهم وفقًا لمعايير واجهات برمجة تطبيقات OpenAI.
يمكن تسجيل النماذج اللغوية الكبيرة الخارجية التي يتم نشرها على بنى تحتية أخرى خارج IBM Z وIBM LinuxONE مع AI Optimizer for Z. ويمكن وضع علامات على هذه النماذج وتجميعها مع النماذج اللغوية الكبيرة المحلية التي تعمل على Spyre لضمان تجميع حالة الاستخدام وتحسينها. بحسب نشر النماذج اللغوية الكبيرة، يمكن دمج مراقبة النماذج اللغوية الكبيرة الخارجية في لوحة معلومات المراقبة عبر المنصات لإعطاء نظرة عامة على الذكاء الاصطناعي التوليدي.
وبحسب حاجة العمل لحالة استخدام الذكاء الاصطناعي التوليدي، قد تكون هناك حاجة إلى نماذج متعددة لتحقيق هدف معين. لذلك، يسمح AI Optimizer for Z بتسجيل النماذج الخارجية التي تعمل خارج IBM Z وIBM LinuxONE لتوحيد نقطة النهاية. يمكن تجميع النماذج اللغوية الكبيرة الخارجية والنماذج اللغوية الكبيرة المحلية معًا من خلال علامات مخصصة يمكن استخدامها في استدلال الطلبات من أجل تلبية احتياجات العمل.
عندما يجتمع AI Optimizer for Z مع watsonx Assistant for Z على مُسرِّع IBM Spyre، تحصل المؤسسات على مزايا الاثنين: الذكاء والأداء في انسجام تام.
يضمن AI Optimizer توجيه كل الاستعلامات والاستدلالات والاستدعاءات النموذجية وتخزينها وتوسيعها لتحقيق أقصى كفاءة، بينما يوفر مساعد watsonx Assistant for Z تفاعلاً طبيعيًا وحواريًا مع العملاء والموظفين.
يعمل النظامان معًا على بنية Spyre عالية الأداء والموفرة للطاقة، ويتيح كلاهما معًا استجابات أسرع وزمن انتقال أقل ورؤية شاملة، ما يحول تفاعلات العملاء إلى تجارب سلسة مدعومة بالذكاء الاصطناعي أكثر ذكاءً وسرعة ومصممة لتناسب نطاق المؤسسات.
