ما هو Amazon SageMaker؟

30 أكتوبر 2024

المؤلفين

Alexandra Jonker

Editorial Content Lead

Alice Gomstyn

IBM Content Contributor

ما هو Amazon SageMaker؟

Amazon SageMaker عبارة عن خدمة مُدارة بالكامل مصممة لتبسيط عملية بناء نماذج التعلم الآلي (ML) وتدريبها ونشرها. 

يعمل SageMaker، الذي أنشأته Amazon Web Services (AWS)، على أتمتة العديد من المهام التي تتطلب عمالة كثيفة في كل مرحلة من مراحل نشر، مما يقلل من تعقيد مهام سير العمل ويسرّع دورة حياة التعلم الآلي بشكل عام. ويمكن أن يؤدي هذا إلى تكرارات أسرع ، ودقة محسّنة، وفي النهاية، قيمة تجارية أكبر من مبادرات التعلم الآلي.

يقدم SageMaker مجموعة من أدوات التعلم الآلي (ML). على سبيل المثال، يتيح Autopilot تدريب نماذج الذكاء الاصطناعي على مجموعات بيانات محددة وتصنيف كل خوارزمية حسب الدقة، بينما تعمل Data Wrangler على تسريع إعداد البيانات، مما يجعل المراحل الأولى من تطوير نماذج التعلم الآلي أكثر كفاءة.

يتضمن SageMaker أيضًا العديد من واجهات برمجة التطبيقات (APIs). تسمح واجهات برمجة التطبيقات هذه لعلماء البيانات والمطورين بإنشاء حلول التعلم الآلي الجاهزة للإنتاج دون تعقيدات إدارة البنية التحتية.

الخلفية: فهم عملية التعلم الآلي

لفهم تأثير Amazon SageMaker، من المهم فهم كيفية عمل التعلم الآلي. يمكن تقسيم عملية التعلم الآلي إلى ثلاثة أجزاء: عملية القرار ودالة الخطأ وتحسين النموذج.

  • عملية اتخاذ القرار: تهدف خوارزميات التعلم الآلي في المقام الأول إلى إجراء التنبؤات أو التصنيفات. باستخدام بيانات الإدخال، سواء كانت مصنفة أو غير مصنفة، يمكن لخوارزميات التعلم الآلي إنشاء تقديرات وتحديد الأنماط داخل البيانات. 

  • دالة الخطأ: تقيّم هذه الدالة دقة تنبؤات النموذج. من خلال مقارنة مخرجات النموذج بالأمثلة المعروفة، تساعد دالة الخطأ في تقييم أداء النموذج وتحديد مجالات التحسين.

  • عملية تحسين النموذج: لتعزيز دقة النموذج، تقوم خوارزميات التعلّم الآلي بتعديل عوامل الترجيح بشكل متكرر بناءً على التباينات بين الأمثلة المعروفة وتقديرات النموذج. وتستمر دورة "التقييم والتحسين" هذه حتى يصل النموذج إلى حد مرضٍ من الدقة.

يمكن أن يساعد Amazon SageMaker في تبسيط هذه العمليات، مما يسمح لعلماء البيانات بنشر نماذج التعلم الآلي بكفاءة. 

ماذا يفعل AWS SageMaker؟

يعمل AWS SageMaker على تبسيط دورة حياة التعلم الآلي من خلال نهج منظم يشمل ثلاث مراحل حاسمة: توليد بيانات الأمثلة والتدريب والنشر. في كل مرحلة، يستطيع المطورون استخدام مثيلات—بيئات معزولة، أو خوادم، لإدارة قاعدة البيانات والموارد، وتعيين معلمات التكوين وتوفير البنية التحتية لتكنولوجيا المعلومات اللازمة. 

إنشاء بيانات الأمثلة

يمكن للمطورين البدء بإنشاء بيانات الأمثلة، وهو أمر ضروري لتدريب نماذج التعلم الآلي (ML). تتضمن هذه العملية جلب وتنظيف وإعداد مجموعات بيانات العالم الحقيقي للمعالجة المسبقة. في بعض الأحيان، يستطيع المطورون استخدام Amazon Ground Truth لإنشاء بيانات صور اصطناعية مصنفة تعمل على تعزيز بيانات الأمثلة أو استبدالها. بمجرد أن تصبح البيانات جاهزة، يمكن تحميل البيانات إلى Amazon Simple Storage Service (S3)، مما يجعلها متاحة للاستخدام مع خدمات AWS المختلفة.

توفر مثيلات دفتر ملاحظات Amazon SageMaker بيئة قوية للمطورين لإعداد بياناتهم ومعالجتها للتدريب. من خلال الوصول إلى البيانات المخزنة في S3، يمكن لـ SageMaker تسريع عملية تطوير النموذج باستخدام مثيلات التعلم الآلي (ML) المُدارة بالكامل لتدريب النماذج وتشغيل الاستدلالات ومعالجة مجموعات البيانات الكبيرة داخل Amazon Elastic Cloud Compute (EC2). 

يدعم SageMaker التعاون في البرمجة عبر تطبيق Jupyter Notebook مفتوح المصدر . يمكن لعلماء البيانات استيراد أدواتهم الخاصة أو استخدام مثيلات دفتر الملاحظات التي تم إنشاؤها مسبقًا والمجهزة ببرامج التشغيل الأساسية ومكتبات التعليمات البرمجية المكتوبة مسبقًا لأطر عمل التعلم العميق الشائعة. يمكن أن تتكون هذه المكتبات من العمليات الرياضية وطبقات الشبكات العصبية وخوارزميات التحسين. 

يوفر SageMaker أيضًا للمطورين المرونة من خلال دعم الخوارزميات المخصصة المجمعة كصور حاوية Docker . إنه يدمجها مع Amazon S3، مما يسمح للفرق بإطلاق مشاريع التعلم الآلي الخاصة بهم بسهولة. يمكن للمطورين توفير خوارزميات التدريب الخاصة بهم أو الاختيار من بين مجموعة من الخوارزميات التي تم إنشاؤها مسبقًا عبر وحدة تحكم SageMaker. تتوفر البرامج التعليمية والموارد لتوجيه المستخدمين خلال هذه العمليات.

التدريب

في مرحلة التدريب، يستخدم المطورون خوارزميات أو نماذج أساسية مدربة مسبقًا للضبط الدقيق لنماذج التعلم الآلي (ML) الخاصة بهم على مجموعة البيانات محددة. يمكن للمطورين تحديد مواقع البيانات في حاويات Amazon S3 وتحديد أنواع المثيلات المناسبة لتحسين عملية التدريب. 

تعمل أدوات التنسيق مثل SageMaker Pipelines على تبسيط سير العمل من خلال أتمتة العملية الشاملة لبناء وتدريب ونشر نماذج التعلم الآلي. يمكن أن يساعد هذا في توفير الوقت والمساعدة في ضمان الدقة في مهام سير العمل. بالإضافة إلى ذلك، يتيح Amazon SageMaker JumpStart للمطورين استخدام النماذج المعدة مسبقًا من خلال واجهة بدون تعليمات برمجية ، مما يتيح التعاون دون الحاجة إلى خبرة تقنية عميقة. 

أثناء تدريب النموذج، يمكن للمطورين استخدام ضبط المعلمات الفائقة في SageMaker لتحسين النماذج اللغوية الكبيرة (LLMs) لتحسين الأداء عبر التطبيقات المختلفة. يقوم Debugger بمراقبة مقاييس الشبكات العصبية، مما يمنح المطورين رؤى في الوقت الفعلي حول أداء النموذج واستخدام الموارد. يمكن أن يساعد هذا في تبسيط عملية تصحيح الأخطاء من خلال السماح لعلماء البيانات بتحديد المشكلات بسرعة وتحليل الاتجاهات وتعيين تنبيهات تلقائية للإدارة الاستباقية. يوفر SageMaker أيضًا إمكانية Edge Manager التي تعمل على توسيع نطاق مراقبة وإدارة التعلم الآلي إلى أجهزة الحافة

عملية النشر

بعد اكتمال التدريب، يدير SageMaker البنية التحتية السحابية الأساسية ويوسعها بشكل مستقل للمساعدة في ضمان نشر سلس. تعتمد هذه العملية على مجموعة من أنواع المثيلات (على سبيل المثال، وحدات معالجة الرسومات، أو GPUs، المُحسّنة لأحمال تشغيل التعلم الآلي). كما ينشر عبر مناطق توفر متعددة—مجموعات من مراكز البيانات المعزولة ولكنها قريبة بما يكفي للحصول على زمن انتقال قصير—لتحسين الموثوقية. تساهم فحوصات السلامة ونقاط النهاية الآمنة HTTPS في تعزيز اتصال التطبيق بشكل أكبر.

وبمجرد النشر، يمكن للمطورين استخدام المقاييس لمراقبة الأداء واكتساب رؤى في الوقت الفعلي وتعيين تنبيهات لأي انحرافات. وبفضل قدرات المراقبة الشاملة، يمكن لـ SageMaker دعم الحوكمة الفعالة طوال دورة حياة التعلم الآلي. ونتيجة لذلك، يمكن للمؤسسات الحفاظ على التحكم والامتثال مع تسخير قوة التعلم الآلي.

ما هي فوائد Amazon SageMaker؟

يقدم Amazon SageMaker مجموعة من الفوائد التي تعزز تجربة التعلم الآلي، بما في ذلك:

  • بيئة التطوير المتكاملة 
  • تدريب النموذج وتحسينه
  • إعداد وتصنيف البيانات
  • الاستدلال في الوقت الحقيقي والدفعات
  • حلول بدون خادم وفعالة من حيث التكلفة
  • المراقبة وتصحيح الأخطاء
  • نماذج التسعير المرنة

بيئة التطوير المتكاملة (IDE)

يُعد Amazon SageMaker Studio بمثابة بيئة تطوير متكامل لعلماء البيانات، حيث يوفر واجهة سهلة الاستخدام لإدارة مهام سير العمل وتطوير النماذج وتصور المقاييس. يدعم Jupyter Notebook، مما يسمح للمستخدمين بكتابة وتشغيل كود Python بكفاءة.

تدريب وتحسين النموذج

يمكن للمستخدمين تدريب نماذج التعلم الآلي باستخدام خوارزميات مدمجة أو خوارزميات مخصصة تستند إلى أطر العمل الشائعة مثل TensorFlow و PyTorch و MXNet. توفر الخدمة ضبط المعلمات الفائقة لتحسين تكوينات النموذج للحصول على أفضل أداء. يتيح SageMaker أيضًا الضبط الدقيق للنماذج المدربة مسبقًا، مما يسمح لعلماء البيانات بتكييف هذه النماذج مع مجموعات البيانات والمهام المحددة.

إعداد وتصنيف البيانات

تعد مجموعات البيانات عالية الجودة ضرورية لإنشاء نماذج تعلم آلي فعالة. توفر Ground Truth خدمة تصنيف البيانات التي تسهل إنشاء مجموعات بيانات تدريبية عالية الجودة من خلال عمليات التصنيف الآلية والمراجعة البشرية. يتضمن Amazon SageMaker أيضًا مخزن ميزات مدمج يسمح للفرق بإدارة ومشاركة واكتشاف الميزات—الإدخالات المستخدمة للتدريب والاستدلال—عبر نماذج التعلم الآلي المختلفة. يمكن أن يساعد ذلك في تبسيط عملية إعداد البيانات وتعزيز التعاون.

الاستنتاج في الوقت الفعلي وبالدفعات

بعد نشر نماذج التعلم الآلي، يسمح SageMaker بالاستدلال في الوقت الفعلي وبالدفعات. يمكن للمستخدمين إنشاء عناوين URL الخاصة بنقاط النهاية—وهي عناوين URL محددة تعمل كنقاط وصول للتطبيقات—لإجراء تنبؤات في الوقت الفعلي وإدارة أعباء العمل بكفاءة. يُعد هذا مفيدًا بشكل خاص للتطبيقات التي تتطلب استجابات فورية، مثل سيناريوهات الذكاء الاصطناعي التوليدي .

حلول بدون خادم وفعالة من حيث التكلفة

ومن خلال ميزات مثل التوسع التلقائي والتكامل مع AWS Lambda، يوفر SageMaker قدرات من دون خوادم تساعد في إدارة موارد الحوسبة بشكل ديناميكي بناءً على الطلب. النتيجة هي تحسين التكاليف وقابلية التوسع.

المراقبة واستكشاف الأخطاء وإصلاحها

يقدم SageMaker أدوات مثل Amazon CloudWatch لمراقبة الأداء في الوقت الفعلي، باستخدام خدمات AWS الأخرى لتوفير رؤية شاملة لسلامة التطبيق. تتيح ميزات التصحيح لعلماء البيانات تتبع المشكلات في تدريب النموذج ونشره، مما يساعد على ضمان دورة حياة قوية للتعلم الآلي

نماذج التسعير المرنة

تقدم AWS نموذجين للتسعير—عند الطلب والدفع حسب الاستخدام—مع اختلاف التكاليف بناءً على أنواع المثيلات وتخزين البيانات والخدمات المستخدمة. كما أن الطبقة المجانية من Amazon SageMaker تتيح للمستخدمين الجدد استكشاف المنصة دون أي تكلفة، مما يوفر إمكانية الوصول إلى مجموعة محدودة من الميزات والموارد. 

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر رؤى وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

حالات استخدام AWS SageMaker

تعدد استخدامات Amazon SageMaker يجعلها مناسبة لحالات الاستخدام المختلفة عبر الصناعات. ومن الأمثلة على ذلك: 

الرعاية الصحية: يمكن لنماذج التعلم الآلي تحليل بيانات المرضى للتنبؤ بالنتائج وتخصيص العلاجات وتعزيز الكفاءة التشغيلية. 

التمويل: يمكن للمؤسسات المالية استخدام Amazon SageMaker لتطوير نماذج للكشف عن الاحتيال والتصنيف الائتماني وتقييم المخاطر. 

البيع بالتجزئة: تستخدم الشركات التحليلات التنبؤية لتحسين إدارة المخزون وتخصيص تجارب العملاء وتحسين استراتيجية التسعير. 

Amazon SageMaker وحوكمة الذكاء الاصطناعي

أدوات مثل Amazon SageMaker يمكن أن تساعد المؤسسات على نشر نماذج التعلم الآلي بفعالية والتي تدفع الابتكار وقيمة الأعمال مع الحفاظ على التحكم في نظام الذكاء الاصطناعي والامتثال التنظيمي. يمكن للمستخدمين الاستفادة من العديد من أدوات الحوكمة، بما في ذلك:

  • إدارة الهوية والوصول (IAM): تتيح هذه الميزة للمستخدمين إدارة الأذونات والأدوار، مما يساعد على ضمان وصول المستخدمين المصرح لهم فقط إلى البيانات الحساسة ونقاط النهاية.

  • التحكم في الإصدار: يمكن للمستخدمين تعقب إصدارات النموذج والتكوينات للحفاظ على مسار تدقيق واضح، وهو أمر ضروري للامتثال والحوكمة.

  • سجل النموذج: يعمل سجل النموذج كمستودع مركزي لإدارة نماذج العمل والبيانات الوصفية، مما يساعد على ضمان الشفافية والمساءلة طوال دورة التطوير.

تعزز مجموعة أدوات تطوير البرمجيات SageMaker Python SDK القدرات في Amazon SageMaker من خلال تمكين التكامل السلس مع مهام سير العمل والخدمات الحالية. يسمح ذلك للمؤسسات بأتمتة عمليات التحقق من الامتثال والحفاظ على الإشراف على مشاريع التعلم الآلي (ML) بشكل أكثر فعالية.

يمكن أيضًا دمج Amazon SageMaker في الاستراتيجية الأوسع للبيانات والذكاء الاصطناعي. شكلت IBM و AWS شراكات استراتيجية لتعزيز قدرات المؤسسات التي تستفيد من الخدمات السحابية. يتيح استخدام نماذج الأساس الخاصة بشركة IBM إلى جانب Amazon SageMaker للفرق الاستفادة من التحليلات المتقدمة وتحسين إدارة البيانات وتبسيط مهام سير العمل. من خلال نشر النماذج داخل Amazon VPC، يمكن للمؤسسات المساعدة في ضمان الوصول الآمن والمراقب إلى الموارد، مما يدعم جهود الحوكمة بشكل أكبر.

وبفضل القدرة على العمل عبر منصات مختلفة مثل Windows، يمكن للمؤسسات الجمع بين أدوات IBM و AWS لتنفيذ حلول الذكاء الاصطناعي والتعلم الآلي المصممة خصيصاً لتلبية احتياجاتها بسهولة. استخدام ™watsonx.governance من IBM بفضل الحلول التي توفرها ميزات SageMaker القوية، يمكن للشركات تسريع مبادرات الذكاء الاصطناعي، وخاصةً في تطبيقات الذكاء الاصطناعي التوليدي  وعمليات التعلم الآلي