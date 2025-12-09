إطلاق العنان للاستدلال بالذكاء الاصطناعي التوليدي على مستوى المؤسسات: الإعلان عن إتاحة AI Optimizer for Z 2.1 بشكل عام من IBM
يتم تسريع الذكاء الاصطناعي التوليدي على IBM Z وتحسين الاستدلال لتحقيق أقصى أداء وكفاءة وأمان.
أصبح AI Optimizer for Z 2.1 من IBM متاحًا الآن بشكل عام، ما يقدم أداءً عاليًا وزمن استجابة قصير لاستدلال الذكاء الاصطناعي التوليدي على IBM Z والمدعوم بواسطة IBM SpyreTM Accelerator. ويمثل هذا الإصدار الخطوة الأولى في خارطة طريق للتسليم المستمر، مع القدرات الإضافية والتحسينات المخطط لطرحها خلال الأرباع القادمة.
يستفيد AI Optimizer for Z من قوة IBM Spyre™ Accelerator (Spyre) لتقديم استنتاجات عالية الأداء وذات زمن انتقال قصير لنماذج الذكاء الاصطناعي التوليدي. ومن خلال دمج Spyre مع القدرات المتقدمة مثل تخزين KV المؤقت والمراقبة في الوقت الحقيقي، ويمكن المؤسسات من تحسين أحمال التشغيل للذكاء الاصطناعي التوليدي عبر البنى بكفاءة وقابلية توسع وأمان لا مثيل له.
تتضمن القدرات الرئيسية AI Optimizer for Z 2.1 ما يلي:
يوفر AI Optimizer for Z مراقبة متقدمة في الوقت الحقيقي لأحمال تشغيل الذكاء الاصطناعي التوليدي باستخدام Prometheus لجمع المقاييس ولعرضها بصريًا بشكل تفاعلي وسهل الفهم. يقوم بتتبع مقاييس رئيسية مثل معدل تمرير الرموز المميزة، وزمن الاستجابة لكل طلب، ونسبة إصابات ذاكرة التخزين المؤقت، والزمن حتى أول رمز مميز، واستخدام الذاكرة، إلى جانب وجود خطة لإضافة مقاييس استخدام الأجهزة مثل معدل استخدام وحدات المعالجة الرسومية (GPU)/المسرّعات.
ويمكن لمحسن الذكاء الاصطناعي التكامل مع جامع OpenTelemetry (OTel) عند تكوينه باستخدام مستقبلات Prometheus. ويتيح ذلك إمكانية الاستيعاب السلس للقياس عن بُعد وقابلية التشغيل البيني لقابلية الملاحظة الموحدة عبر البيئات الهجينة. وتعمل هذه الرؤى على تمكين المجموعات من اتخاذ قرارات مستنيرة بشأن تخطيط السعة، وتوجيه أحمال التشغيل، ومراقبة الأداء وتحسين البنية التحتية، ما يساعد على تجنب الإفراط في التزويد، وخفض التكاليف، وتحسين الأداء الإجمالي.
في خطة تسليم مرحلية، سيقدم اAI Optimizer for Z التخزين المؤقت متعدد المستويات لتسريع استدلال الذكاء الاصطناعي التوليدي.
في المستوى الأول، يقوم التخزين المؤقت KV بإعادة استخدام تسلسلات الرموز المميزة التي تم حسابها مسبقًا داخل عملية نشر واحدة لنموذج لغوي كبير (LLM)، ما يقلل الزمن حتى أول رمز مميز ويحسن الإنتاجية.
وفي المستوى الثاني، شارك التخزين المؤقت الممتد في هذه العمليات الحسابية عبر عمليات نشر متعددة للنماذج اللغوية الكبيرة، ما يتيح كفاءة أكبر لأحمال التشغيل واسعة النطاق. ويُترجم هذا الموهبة إلى قيمة تجارية كبيرة من خلال خفض تكاليف البنية التحتية، وتحسين أوقات الاستجابة للتطبيقات التي تواجه العملاء وتمكين المؤسسات من الوصول إلى النطاق الواسع من خدمات الذكاء الاصطناعي دون الإفراط في توفير الموارد.
يتيح AI Optimizer for Z وضع علامات مرنة للنماذج اللغوية الكبيرة (LLM)، ما يسمح للمستخدمين بتجميع النماذج حسب التطبيق أو حالة الاستخدام التجاري أو متطلبات الأداء. ويمكن تطبيق هذه العلامات على طلبات الاستدلال، ما يضمن التوجيه الذكي والاستخدام الأمثل للموارد عبر عمليات نشر متعددة.
بالإضافة إلى ذلك، يدعم الحل تسجيل النماذج اللغوية الكبيرة الخارجية التي تعمل خارج IBM Z أو LinuxONE، ما يعمل على الدمج في نفس إطار عمل الوسم والتوجيه للتحسين الموحد. وتوفر هذه القدرة للمؤسسات تحكمًا ومرونة أكبر، ما يتيح أداءً ثابتًا وكفاءة في التكلفة عبر بيئات الذكاء الاصطناعي الهجينة.
تواجه المجموعات التي تعمل على IBM Z قيودًا فريدة مثل إقامة البيانات، ومتطلبات الخصوصية، ومتطلبات زمن الانتقال القصير، والموثوقية الحرجة في المهام. يمكن AI Optimizer for Z 2.1 تبني الذكاء الاصطناعي التوليدي دون الحاجة إلى تحريك حمل التشغيل أو المخاطر الهندسية، ما يوفر قيمة فورية عبر الصناعات مثل البنوك والتأمين والتصنيع والقطاع العام. ومع نهج التسليم المستمر، يمكن للمؤسسات توقع تحسينات مستمرة تعزز الأداء وقابلية التوسع والأمان بشكل أكبر
تمثل الإتاحة بشكل عام لـ AI Optimizer for Z 2.1 بداية خارطة طريق أوسع نطاقًا. وتتوفر الآن قدرات الاستدلال الأساسي وقابلية الملاحظة، وسيتم تقديم تحسينات إضافية من خلال إصدارات تدريجية خلال الأرباع القادمة، ما يضمن أن العملاء يمكنهم الاستمرار في الاستفادة من الابتكار دون انقطاع.