ما الجبر الخطي للتعلم الآلي؟

مؤلف

Fangfang Lee

Developer Advocate

IBM

ما الجبر الخطي للتعلم الآلي؟

في التعلم الآلي، يتضمن الجبر الخطي استخدام العمليات الرياضية لتمثيل ومعالجة البيانات والمعلمات والعمليات الحسابية داخل نماذج التعلم الآلي. وتوفر اللغة والأدوات للتعبير عن كيفية تدفق البيانات عبر النماذج وكيف "تتعلم" النماذج.

يتم تشغيل خوارزميات التعلم الآلي الحديثة القوية والذكاء الاصطناعي التوليدي، في جوهرها، بواسطة الجبر الخطي. سواء أكان الأمر يتعلق بتدريب الشبكات العصبية أم بناء نظام توصية أم تطبيق تحليل المكونات الأساسية (PCA) على مجموعة البيانات المعقدة والعالية الأبعاد، فإن الممارسين يستخدمون الجبر الخطي لإجراء حسابات ضخمة.

أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء

احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! لقد اشتركت بنجاح.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

أهمية الجبر الخطي

ومنذ بدايات الجبر الخطي الأولى وحتى تطوراته الأخيرة في التعلم العميق، ظل الجبر الخطي موجودًا في كل مكان في مشهد التعلم الآلي. بل إن العديد من نماذج التعلم الآلي الأساسية وحلها يتم التعبير عنه بشكل أساسي باستخدام مبادئ الجبر الخطي. وفي واقع الممارسات العملية، نادرًا ما تكون البيانات مجرد رقم واحد بسيط، بل غالبًا تأتي البيانات في شكل مجموعات بيانات: مجموعات من نقاط البيانات الفوضوية في كثير من الأحيان. هنا يأتي الجبر الخطي ليوفر الأدوات اللازمة لتنظيم هذه البيانات ومعالجتها وتحليلها بكفاءة.

فهو يتيح للممارسين معالجة كائنات مثل المتجهات والمصفوفات والموترات لتمثيل البيانات المنظمة (غالبًا ما تكون بيانات مجدولة) والبيانات غير المنظمة مثل الصور أو مقاطع الفيديو. وهذه مفاهيم تبدو تجريدية لكنها هي لغة البيانات لعلوم الكمبيوتر وعالم البيانات. على سبيل المثال، يمكن تمثيل الصورة على شكل مصفوفة من قيم البكسل، ويمكن تمثيل مجموعة من السمات (الخصائص) التي تصف المنزل (مثل الحي السكني والعمر والمساحة المربعة) على شكل متجه في نموذج الانحدار. حيث يقوم الانحدار الخطي بنمذجة الإخراج كمجموعة خطية من سمات الإدخال، وهو مثال كلاسيكي لكيفية عمل الجبر الخطي في العالم الحقيقي.  

مفاهيم الجبر الخطي الرئيسية

في التعلم الآلي وعلم البيانات، نجد أن الجبر الخطي هو إطار العمل المستخدم لوصف البيانات والتعامل معها. فهو يشرح كيفية ترتيب الأعداد ودمجها وتحويلها؛ سواء كان ذلك بضرب المصفوفات في شبكات عصبية، أو إيجاد القيم الذاتية في التحليل البنائي متعدد الأبعاد أو تقليل الأبعاد باستخدام تحليل القيمة المفردة (SVD).  

تمثيل البيانات ومعالجتها

يوفر الجبر الخطي، في أبسط مستوياته، الأدوات اللازمة لتمثيل البيانات والعمل معها في أشكال منظمة. وتبدأ معظم عمليات سير عمل التعلّم الآلي بتنظيم البيانات في تنسيقات رقمية، وكل بنية - سواء كانت كمية أو متجهة أو مصفوفة أو مكثفة - تخدم غرضًا مختلفًا.

  • والكمية القياسية هي أبسط وحدة بناء، وهي عبارة عن قيمة عددية واحدة، مثل 5 أو 2.3. وغالبًا تمثل مقاييس القياسات معلمات أو عوامل قياس أو قياسات مفردة.

  • المتجه عبارة عن مصفوفة مرتبة من الأرقام، وعادةً ما تُكتب على هيئة عمود أو صف. ويمكن أن تمثل المتجهات أي شيء بدءًا من قائمة من الميزات التي تصف نقطة بيانات واحدة إلى إحداثيات موضع في الفضاء. على سبيل المثال، يمكن أن يمثل المتجه [3،5،7] عدد الزيارات والمشتريات والمرتجعات للعميل.

  • المصفوفة عبارة عن مصفوفة ثنائية الأبعاد من الأعداد مرتبة في صفوف وأعمدة. وتشكل مجموعة البيانات حيث يكون كل صف نقطة بيانات وكل عمود عبارة عن سمة (خاصية) بشكل طبيعي مصفوفة. وتعتبر المصفوفات مركزية للجبر الخطي؛ لأنها تسمح بتخزين البيانات بكفاءة. تنتشر العمليات مثل الضرب في عدد ثابت (حيث يُضرب كل عنصر من عناصر المصفوفة في العدد نفسه) وضرب المصفوفات (التي تُستخدم لدمج مصفوفتين لتطبيق تحويلات أو حساب علاقات) في الخوارزميات بشكل واسع.

  • الموتِّر هو تعميم للكميات القياسية والمتجهات والمصفوفات على أبعاد أعلى. فعلى سبيل المثال، قد تُخزَّن الصورة الملونة على شكل موتِّر ثلاثي الأبعاد، بحيث تشكل محاور الارتفاع والعرض وقنوات الألوان ثلاثة أبعاد منفصلة. وفي التعلم العميق، تعد الموتِّرات هي بنية البيانات القياسية لتغذية المعلومات في الشبكات العصبية.

حاصل الضرب النقطي هو طريقة لضرب متجهين لإنتاج كمية قياسية واحدة. ويُستخدم هذا المفهوم على نطاق واسع لحساب التشابه بين المتجهات، وهي خطوة حاسمة في العديد من أنظمة التوصية. ويُعدّ تدوير المصفوفة، وهو عملية تقلب صفوفها وأعمدتها، عملية أساسية أخرى تُمكِّن من محاذاة الأبعاد اللازمة لإجراء عملية الضرب، بالإضافة إلى الكشف عن الأنماط الهيكلية الكامنة في البيانات.

يمكّن الجبر الخطي من التعبير عن مجموعات البيانات المعقدة بطريقة يمكن للخوارزميات فهمها ومعالجتها، مما يسمح ببناء نماذج معقدة باستخدام عدد كبير من البيانات التي تم جمعها من العالم الحقيقي. 

A comparison chart illustrating scalar, vector, matrix, and tensor concepts. The image uses colorful numerical representations to differentiate each mathematical structure. Numbers such as '1', '2', '5', and '6' are clearly visible within the matrix and tensor examples.

فهم الخوارزميات

تم بناء العديد من خوارزميات التعلم الآلي على نظام المعادلات الخطية. الانحدار الخطي هو خوارزمية بسيطة لكنها قوية تُستخدَم للتنبؤ بالقيم المستمرة. وغالبًا ما تتلخص عملية العثور على الخط أو المستوى "الأنسب" الذي يقلل من الخطأ بين القيم المتوقعة والفعلية في حل نظام من المعادلات الخطية. على سبيل المثال، عند التنبؤ بأسعار المنازل بناءً على المساحة بالقدم المربع وعدد غرف النوم، يجب العثور على المعاملات (الأوزان) لتلبية معادلات مثل:

 price=w1*squarefootage+w2*numberofbedrooms+b

...حيث  w1w2 و  b  هي المعاملات المجهولة التي يجب حلها. يمكن تمثيل هذا وحله باستخدام المصفوفات. تستخدم أساليب مثل "المربعات الصغرى" للعثور على الحلول التقريبية لهذه الأنظمة عندما لا يكون هناك حل دقيق، وهو ما يحدث غالبًا مع البيانات الضجيجية في العالم الحقيقي. بمعنى آخر، يتم تمثيل تقريب دالة الخسارة على أنها مجموعة من المعادلات الخطية التي يتم حلها باستخدام حساب التفاضل والتكامل.

تعتمد الخوارزميات الأكثر تعقيدًا، كتلك الموجودة في التعلم العميق والشبكات العصبية، اعتمادًا كبيرًا على عمليات مثل الضرب الهائل للمصفوفات لمعالجة المعلومات عبر طبقات مختلفة. حيث تقوم كل طبقة في الشبكات العصبية بإجراء التحول الخطي على الإدخال، وهو في الأساس تحويل مصفوفة حيث يتم ضرب متجه الإدخال في مصفوفة وزن. وهذا يتيح للشبكة تعلم الأنماط والعلاقات المعقدة داخل البيانات.

تخفيض الأبعاد

تحتوي العديد من مجموعات البيانات الواقعية على عدد كبير من السمات (أو المتغيرات) لكل نقطة بيانات: تقدر أحيانًا بالمئات أو الآلاف بل الملايين. وهذا هو ما يُسمَّى بالبيانات عالية الأبعاد. ورغم أن المزيد من السمات (الخصائص) قد تبدو وكأنها يجب أن تجعل النماذج أكثر دقة، إلا إنها غالبًا ما تجعل التعلم أكثر صعوبة. وقد تكون البيانات عالية الأبعاد مكلفة حسابيًا لمعالجتها، وتستهلك قدرًا كبيرًا من الذاكرة في تخزينها، كما أنها عرضة للإفراط في التجهيز، حيث يحفظ النموذج الضجيج بدلًا من تعلم أنماط ذات معنى.

التحدي الآخر هو ما يُسمَّى لعنة الأبعاد. فكلما زاد عدد الأبعاد، أصبحت نقاط البيانات متباعدة (متناثرة) بشكل متزايد في فضاء السمات (الخصائص)، ويصبح مفهوم "القرب" بين النقاط أقل معنى. وهذا التباين يجعل من الصعب على الخوارزميات اكتشاف العلاقات بشكل موثوق به. لذلك، فإن امتلاك الأدوات المناسبة لتقليل كمية السمات (الخصائص) واستخراج الإشارات من الضجيج أمر محوري. تقليل الأبعاد هو عملية تحويل البيانات من فضاء عالي الأبعاد إلى فضاء ذي أبعاد أقل مع الحفاظ على أكبر قدر ممكن من الهيكل الأصلي والمعلومات المهمة. من خلال تقليل عدد السمات (الخصائص)، يمكن للممارسين تبسيط النماذج وتحسين التعميم وتسريع العمليات الحسابية وإجراء عرض مصور للبيانات في كثير من الأحيان.

الجبر الخطي هو جوهر العديد من أساليب تقليل الأبعاد. على سبيل المثال، يستخدم تحليل المكونات الرئيسية مفاهيم مثل القيم الأصلية والمتجهات الأصلية للعثور على محاور جديدة (مكونات رئيسية) تلتقط أقصى قدر من التباين في مجموعة البيانات، والتي تمثل سمة ذات معنى في مجموعة البيانات عالية الأبعاد. ومن خلال إسقاط البيانات على العناصر الرئيسية القليلة الأولى، يحتفظ الممارسون بالأنماط الأكثر أهمية بينما يتجاهلون الفوارق الأقل فائدة.

على سبيل المثال، تخيل مجموعة البيانات تصف آلاف العملاء مع 100 سمة مختلفة لكل منهم (العمر، والدخل، والإنفاق في فئات المنتجات المختلفة، وما إلى ذلك). فسيكون تحليل جميع السمات (الخصائص) المائة في وقت واحد عملية بطيئة ومعقدة، وقد يكون الكثير منها زائدًا عن الحاجة (على سبيل المثال، غالبًا يتداخل الاهتمام "الأدوات الرياضية" مع "أدوات أنشطة الهواء الطلق"). بإمكان تحليل المكونات الرئيسية (PCA) تقليل مجموعة البيانات واختزالها إلى عنصرين فقط أو ثلاثة عناصر تلخص أغلب التباين في سلوك العملاء، مما يسهل تصور البيانات المعقدة، ورفع كفاءة وسرعة تشغيل الخوارزميات النهائية.

باختصار، يعد تقليل الأبعاد طريقة لفصل البيانات المعقدة إلى أجزائها الأكثر إفادة، ويوفر الجبر الخطي الآلية الرياضية لجعل ذلك ممكنًا.

تحليل المكونات الرئيسية

تصف القيم الأصلية والمتجهات الأصلية والتركيب الأصلي معًا الأنماط الأساسية لسلوك التحول أو النظام الخطي:

  • المتجه الذاتي: تخيل تحولًا خطيًا (مثل مدّ فضاء متجهي أو تدويره). المتجه الذاتي لمصفوفة مربعة هو متجه لا يساوي صفرًا، وعند تطبيق التحول عليه، لا يتغير إلا بعامل قياسي. ولا يغير اتجاهه. فهو اتجاه خاص في البيانات يظل مستقرًا في ظل التحول.
  • القيمة الذاتية: هذا هو العامل القياسي الذي يُقاس به المتجه الذاتي. فهو يخبرك بمقدار مدّ المتجه الذاتي أو ضغطه أثناء التحول. في تحليل PCA، تتوافق القيم الذاتية الأكبر مع المكونات الرئيسية التي تلتقط المزيد من التباين في البيانات.
  • التحليل الذاتي: هي عملية تفكيك مصفوفة مربعة إلى مجموعة من متجهاتها الذاتية وقيمها الذاتية. ففي مصفوفة معينة، إذا تمكن المرء من العثور على متجهاتها الذاتية وقيمها الذاتية، فيمكن للمرء إعادة بناء المصفوفة الأصلية منها. في تحليل PCA، يسمح التحليل الذاتي لمصفوفة التباين المشترك للبيانات بتحديد العناصر الرئيسية (المتجهات الأصلية) التي تمثل التباين في البيانات على أفضل وجه، مرتبة حسب قيمها الأصلية المقابلة.

وهناك أسلوب آخر قوي، وهو تحليل القيمة المفردة (SVD)، والذي يمثل دورًا حاسمًا في تقليل الأبعاد، ويعد أساسيًا في مجالات مثل تحليل المصفوفات في أنظمة التوصيات. وعلى الرغم من ارتباطه بالتحلل الذاتي، يمكن تطبيق تحليل SVD على أي مصفوفة (وليس فقط مصفوفات مربعة) ويوفر طريقة أكثر عمومية لتحلُل المصفوفة إلى الأجزاء المكونة لها، والكشف عن الهياكل الأساسية وتقليل الأبعاد بشكل فعال. على سبيل المثال، في أنظمة التوصيات، يساعد تحليل SVD على تحليل مصفوفة التفاعل بين المستخدم والعنصر إلى مصفوفات ذات أبعاد أقل تمثل سمة المستخدمين والعناصر، وتُستخدم بعد ذلك للتنبؤ بالتوصيات الجديدة.

التحسين

تنطوي العديد من نماذج التعلم الآلي على مشكلات تحسين، حيث يكون الهدف هو العثور على أفضل مجموعة من المعلمات لنموذج يقلل من دالة الخطأ لأدنى حد أو يزيد من دالة الاحتمال إلى أقصى حد. توجد خوارزميات مثل خوارزمية الانحدار التدريجي، والتي تُستخدم على نطاق كبير في تدريب الشبكات العصبية وخوارزميات التعلم الآلي الأخرى، تعتمد على الجبر الخطي لحساب التدرجات (المتجهات التي تشير في اتجاه الصعود الأكثر انحدارًا للدالة) وتحديث معلمات النموذج بشكل تكراري.

يعني فهم التحسين فهم خصائص المصفوفات المشاركة في هذه الحسابات كذلك. وهنا تصبح مفاهيم مثل المُحدِّد ومصفوفة الوحدة ذات صلة بالموضوع. مُحدِّد المصفوفة المربعة هو رقم واحد يوفر معلومات مهمة حول المصفوفة. على سبيل المثال، يشير المُحدِّد الذي لا يساوي صفرًا إلى أن المصفوفة قابلة للعكس (بمعنى أن لها عملية عكس مصفوفة مناظرة)، وهو أمر حساس لحل أنظمة المعادلات الخطية بشكل فريد. أما إذا كان المُحدِّد صفرًا، فقد لا يكون للنظام حل فريد أو العديد من الحلول اللانهائية، مما يشير إلى مشكلات مثل الاستقلال الخطي (حيث يمكن التعبير عن متجه واحد في المجموعة الواحدة كمجموعة خطية من الآخرين). وتعتبر مصفوفة الوحدة (مصفوفة مربعة يكون جميع عناصر قطرها الرئيسي هي 'الواحدات' وبقية عناصرها 'أصفار')، وخاصة لأنه عند ضرب أي مصفوفة في مصفوفة الوحدة، تظل المصفوفة الأصلية دون تغيير، وتعمل مثل الرقم "1" في الضرب العددي.

Mixture of Experts | 28 أغسطس، الحلقة 70

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

الأدوات والمزيد من الاستكشاف

الخبر السار هو أن ممارسي التعلم الآلي لا يحتاجون إلى إجراء هذه العمليات الحسابية المعقدة يدويًا. فهناك مكتبات مثل NumPy في Python توفر دوال محسّنة جدًا لجميع مفاهيم الجبر الخطي هذه، مما يجعلها المعيار الفعلي للحوسبة العددية في التعلم الآلي. على سبيل المثال، numpy.linalg.eig() حساب القِيَم الأصلية والمتجهات الأصلية، وnumpy.dot() ويتعامل مع حاصل الضرب النقطي ومضاعفات المصفوفة بسهولة. وتستفيد إطارات العمل مثل TensorFlow (الشائعة في التعلم العميق) بشكل كبير من الجبر الخطي في الداخل، مما يؤدي إلى تجريد التفاصيل منخفضة المستوى حتى يتمكن المستخدمون من التركيز على بناء النماذج.

هذه المقدمة الموجزة عن الجبر الخطي في سياق التعلم الآلي لا تفي الموضوع حقه، فالمفاهيم أوسع بكثير. وتصف مفاهيم مثل التحويل الخطي وتحويل المصفوفة كيف يمكن معالجة البيانات وإعادة تشكيلها، على سبيل المثال، تدوير صورة أو تحجيم سماتها. يُعد فهم أنواع المصفوفات، مثل مصفوفة الوحدة (التي تترك المتجهات دون تغيير عند ضربها بها، والمصفوفة المتعامدة (التي يكون معكوسها ببساطة هو منقولها) أمرًا مفيدًا أيضًا لتبسيط الحسابات. ورغم أن المرء لن يقوم عادةً بإجراء الحذف الغاوسي (خوارزمية لحل نظام المعادلات الخطية) يدويًا في التعلم الآلي، إلا إن فهم مبادئها يضيء كيفية حل هذه الأنظمة حسابيًا. ويُعد الاستقلال الخطي أمرًا بالغ الأهمية أيضًا لفهم تفرُّد الحلول وأساس الفضاء الاتجاهي (مجموعة كل التركيبات الخطية الممكنة لمجموعة من المتجهات).

في نهاية المطاف، فإن الفهم القوي لمفاهيم الجبر الخطي يُمكِّن ممارسى التعلم الآلي ليس فقط من استخدام خوارزميات التعلم الآلي المبنية مسبقًا ولكن يساعدهم أيضًا على فهم طريقة عملها الداخلية بشكل حقيقي، وتصحيحها بشكل فعال، بل وتطوير حلول جديدة. فهو الجندي المجهول الذي قاد جهود التعلم الآلي الشاقة لعقود من الزمن، دون أن يكون محط الأضواء، ولا يزال مستمرًا في مستقبل الذكاء الاصطناعي.

حلول ذات صلة
IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي
الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا