أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء
احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.
في التعلم الآلي، يتضمن الجبر الخطي استخدام العمليات الرياضية لتمثيل ومعالجة البيانات والمعلمات والعمليات الحسابية داخل نماذج التعلم الآلي. وتوفر اللغة والأدوات للتعبير عن كيفية تدفق البيانات عبر النماذج وكيف "تتعلم" النماذج.
يتم تشغيل خوارزميات التعلم الآلي الحديثة القوية والذكاء الاصطناعي التوليدي، في جوهرها، بواسطة الجبر الخطي. سواء أكان الأمر يتعلق بتدريب الشبكات العصبية أم بناء نظام توصية أم تطبيق تحليل المكونات الأساسية (PCA) على مجموعة البيانات المعقدة والعالية الأبعاد، فإن الممارسين يستخدمون الجبر الخطي لإجراء حسابات ضخمة.
احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.
ومنذ بدايات الجبر الخطي الأولى وحتى تطوراته الأخيرة في التعلم العميق، ظل الجبر الخطي موجودًا في كل مكان في مشهد التعلم الآلي. بل إن العديد من نماذج التعلم الآلي الأساسية وحلها يتم التعبير عنه بشكل أساسي باستخدام مبادئ الجبر الخطي. وفي واقع الممارسات العملية، نادرًا ما تكون البيانات مجرد رقم واحد بسيط، بل غالبًا تأتي البيانات في شكل مجموعات بيانات: مجموعات من نقاط البيانات الفوضوية في كثير من الأحيان. هنا يأتي الجبر الخطي ليوفر الأدوات اللازمة لتنظيم هذه البيانات ومعالجتها وتحليلها بكفاءة.
فهو يتيح للممارسين معالجة كائنات مثل المتجهات والمصفوفات والموترات لتمثيل البيانات المنظمة (غالبًا ما تكون بيانات مجدولة) والبيانات غير المنظمة مثل الصور أو مقاطع الفيديو. وهذه مفاهيم تبدو تجريدية لكنها هي لغة البيانات لعلوم الكمبيوتر وعالم البيانات. على سبيل المثال، يمكن تمثيل الصورة على شكل مصفوفة من قيم البكسل، ويمكن تمثيل مجموعة من السمات (الخصائص) التي تصف المنزل (مثل الحي السكني والعمر والمساحة المربعة) على شكل متجه في نموذج الانحدار. حيث يقوم الانحدار الخطي بنمذجة الإخراج كمجموعة خطية من سمات الإدخال، وهو مثال كلاسيكي لكيفية عمل الجبر الخطي في العالم الحقيقي.
في التعلم الآلي وعلم البيانات، نجد أن الجبر الخطي هو إطار العمل المستخدم لوصف البيانات والتعامل معها. فهو يشرح كيفية ترتيب الأعداد ودمجها وتحويلها؛ سواء كان ذلك بضرب المصفوفات في شبكات عصبية، أو إيجاد القيم الذاتية في التحليل البنائي متعدد الأبعاد أو تقليل الأبعاد باستخدام تحليل القيمة المفردة (SVD).
يوفر الجبر الخطي، في أبسط مستوياته، الأدوات اللازمة لتمثيل البيانات والعمل معها في أشكال منظمة. وتبدأ معظم عمليات سير عمل التعلّم الآلي بتنظيم البيانات في تنسيقات رقمية، وكل بنية - سواء كانت كمية أو متجهة أو مصفوفة أو مكثفة - تخدم غرضًا مختلفًا.
حاصل الضرب النقطي هو طريقة لضرب متجهين لإنتاج كمية قياسية واحدة. ويُستخدم هذا المفهوم على نطاق واسع لحساب التشابه بين المتجهات، وهي خطوة حاسمة في العديد من أنظمة التوصية. ويُعدّ تدوير المصفوفة، وهو عملية تقلب صفوفها وأعمدتها، عملية أساسية أخرى تُمكِّن من محاذاة الأبعاد اللازمة لإجراء عملية الضرب، بالإضافة إلى الكشف عن الأنماط الهيكلية الكامنة في البيانات.
يمكّن الجبر الخطي من التعبير عن مجموعات البيانات المعقدة بطريقة يمكن للخوارزميات فهمها ومعالجتها، مما يسمح ببناء نماذج معقدة باستخدام عدد كبير من البيانات التي تم جمعها من العالم الحقيقي.
تم بناء العديد من خوارزميات التعلم الآلي على نظام المعادلات الخطية. الانحدار الخطي هو خوارزمية بسيطة لكنها قوية تُستخدَم للتنبؤ بالقيم المستمرة. وغالبًا ما تتلخص عملية العثور على الخط أو المستوى "الأنسب" الذي يقلل من الخطأ بين القيم المتوقعة والفعلية في حل نظام من المعادلات الخطية. على سبيل المثال، عند التنبؤ بأسعار المنازل بناءً على المساحة بالقدم المربع وعدد غرف النوم، يجب العثور على المعاملات (الأوزان) لتلبية معادلات مثل:
...حيث , و هي المعاملات المجهولة التي يجب حلها. يمكن تمثيل هذا وحله باستخدام المصفوفات. تستخدم أساليب مثل "المربعات الصغرى" للعثور على الحلول التقريبية لهذه الأنظمة عندما لا يكون هناك حل دقيق، وهو ما يحدث غالبًا مع البيانات الضجيجية في العالم الحقيقي. بمعنى آخر، يتم تمثيل تقريب دالة الخسارة على أنها مجموعة من المعادلات الخطية التي يتم حلها باستخدام حساب التفاضل والتكامل.
تعتمد الخوارزميات الأكثر تعقيدًا، كتلك الموجودة في التعلم العميق والشبكات العصبية، اعتمادًا كبيرًا على عمليات مثل الضرب الهائل للمصفوفات لمعالجة المعلومات عبر طبقات مختلفة. حيث تقوم كل طبقة في الشبكات العصبية بإجراء التحول الخطي على الإدخال، وهو في الأساس تحويل مصفوفة حيث يتم ضرب متجه الإدخال في مصفوفة وزن. وهذا يتيح للشبكة تعلم الأنماط والعلاقات المعقدة داخل البيانات.
تحتوي العديد من مجموعات البيانات الواقعية على عدد كبير من السمات (أو المتغيرات) لكل نقطة بيانات: تقدر أحيانًا بالمئات أو الآلاف بل الملايين. وهذا هو ما يُسمَّى بالبيانات عالية الأبعاد. ورغم أن المزيد من السمات (الخصائص) قد تبدو وكأنها يجب أن تجعل النماذج أكثر دقة، إلا إنها غالبًا ما تجعل التعلم أكثر صعوبة. وقد تكون البيانات عالية الأبعاد مكلفة حسابيًا لمعالجتها، وتستهلك قدرًا كبيرًا من الذاكرة في تخزينها، كما أنها عرضة للإفراط في التجهيز، حيث يحفظ النموذج الضجيج بدلًا من تعلم أنماط ذات معنى.
التحدي الآخر هو ما يُسمَّى لعنة الأبعاد. فكلما زاد عدد الأبعاد، أصبحت نقاط البيانات متباعدة (متناثرة) بشكل متزايد في فضاء السمات (الخصائص)، ويصبح مفهوم "القرب" بين النقاط أقل معنى. وهذا التباين يجعل من الصعب على الخوارزميات اكتشاف العلاقات بشكل موثوق به. لذلك، فإن امتلاك الأدوات المناسبة لتقليل كمية السمات (الخصائص) واستخراج الإشارات من الضجيج أمر محوري. تقليل الأبعاد هو عملية تحويل البيانات من فضاء عالي الأبعاد إلى فضاء ذي أبعاد أقل مع الحفاظ على أكبر قدر ممكن من الهيكل الأصلي والمعلومات المهمة. من خلال تقليل عدد السمات (الخصائص)، يمكن للممارسين تبسيط النماذج وتحسين التعميم وتسريع العمليات الحسابية وإجراء عرض مصور للبيانات في كثير من الأحيان.
الجبر الخطي هو جوهر العديد من أساليب تقليل الأبعاد. على سبيل المثال، يستخدم تحليل المكونات الرئيسية مفاهيم مثل القيم الأصلية والمتجهات الأصلية للعثور على محاور جديدة (مكونات رئيسية) تلتقط أقصى قدر من التباين في مجموعة البيانات، والتي تمثل سمة ذات معنى في مجموعة البيانات عالية الأبعاد. ومن خلال إسقاط البيانات على العناصر الرئيسية القليلة الأولى، يحتفظ الممارسون بالأنماط الأكثر أهمية بينما يتجاهلون الفوارق الأقل فائدة.
على سبيل المثال، تخيل مجموعة البيانات تصف آلاف العملاء مع 100 سمة مختلفة لكل منهم (العمر، والدخل، والإنفاق في فئات المنتجات المختلفة، وما إلى ذلك). فسيكون تحليل جميع السمات (الخصائص) المائة في وقت واحد عملية بطيئة ومعقدة، وقد يكون الكثير منها زائدًا عن الحاجة (على سبيل المثال، غالبًا يتداخل الاهتمام "الأدوات الرياضية" مع "أدوات أنشطة الهواء الطلق"). بإمكان تحليل المكونات الرئيسية (PCA) تقليل مجموعة البيانات واختزالها إلى عنصرين فقط أو ثلاثة عناصر تلخص أغلب التباين في سلوك العملاء، مما يسهل تصور البيانات المعقدة، ورفع كفاءة وسرعة تشغيل الخوارزميات النهائية.
باختصار، يعد تقليل الأبعاد طريقة لفصل البيانات المعقدة إلى أجزائها الأكثر إفادة، ويوفر الجبر الخطي الآلية الرياضية لجعل ذلك ممكنًا.
تصف القيم الأصلية والمتجهات الأصلية والتركيب الأصلي معًا الأنماط الأساسية لسلوك التحول أو النظام الخطي:
وهناك أسلوب آخر قوي، وهو تحليل القيمة المفردة (SVD)، والذي يمثل دورًا حاسمًا في تقليل الأبعاد، ويعد أساسيًا في مجالات مثل تحليل المصفوفات في أنظمة التوصيات. وعلى الرغم من ارتباطه بالتحلل الذاتي، يمكن تطبيق تحليل SVD على أي مصفوفة (وليس فقط مصفوفات مربعة) ويوفر طريقة أكثر عمومية لتحلُل المصفوفة إلى الأجزاء المكونة لها، والكشف عن الهياكل الأساسية وتقليل الأبعاد بشكل فعال. على سبيل المثال، في أنظمة التوصيات، يساعد تحليل SVD على تحليل مصفوفة التفاعل بين المستخدم والعنصر إلى مصفوفات ذات أبعاد أقل تمثل سمة المستخدمين والعناصر، وتُستخدم بعد ذلك للتنبؤ بالتوصيات الجديدة.
تنطوي العديد من نماذج التعلم الآلي على مشكلات تحسين، حيث يكون الهدف هو العثور على أفضل مجموعة من المعلمات لنموذج يقلل من دالة الخطأ لأدنى حد أو يزيد من دالة الاحتمال إلى أقصى حد. توجد خوارزميات مثل خوارزمية الانحدار التدريجي، والتي تُستخدم على نطاق كبير في تدريب الشبكات العصبية وخوارزميات التعلم الآلي الأخرى، تعتمد على الجبر الخطي لحساب التدرجات (المتجهات التي تشير في اتجاه الصعود الأكثر انحدارًا للدالة) وتحديث معلمات النموذج بشكل تكراري.
يعني فهم التحسين فهم خصائص المصفوفات المشاركة في هذه الحسابات كذلك. وهنا تصبح مفاهيم مثل المُحدِّد ومصفوفة الوحدة ذات صلة بالموضوع. مُحدِّد المصفوفة المربعة هو رقم واحد يوفر معلومات مهمة حول المصفوفة. على سبيل المثال، يشير المُحدِّد الذي لا يساوي صفرًا إلى أن المصفوفة قابلة للعكس (بمعنى أن لها عملية عكس مصفوفة مناظرة)، وهو أمر حساس لحل أنظمة المعادلات الخطية بشكل فريد. أما إذا كان المُحدِّد صفرًا، فقد لا يكون للنظام حل فريد أو العديد من الحلول اللانهائية، مما يشير إلى مشكلات مثل الاستقلال الخطي (حيث يمكن التعبير عن متجه واحد في المجموعة الواحدة كمجموعة خطية من الآخرين). وتعتبر مصفوفة الوحدة (مصفوفة مربعة يكون جميع عناصر قطرها الرئيسي هي 'الواحدات' وبقية عناصرها 'أصفار')، وخاصة لأنه عند ضرب أي مصفوفة في مصفوفة الوحدة، تظل المصفوفة الأصلية دون تغيير، وتعمل مثل الرقم "1" في الضرب العددي.
الخبر السار هو أن ممارسي التعلم الآلي لا يحتاجون إلى إجراء هذه العمليات الحسابية المعقدة يدويًا. فهناك مكتبات مثل NumPy في Python توفر دوال محسّنة جدًا لجميع مفاهيم الجبر الخطي هذه، مما يجعلها المعيار الفعلي للحوسبة العددية في التعلم الآلي. على سبيل المثال، numpy.linalg.eig() حساب القِيَم الأصلية والمتجهات الأصلية، وnumpy.dot() ويتعامل مع حاصل الضرب النقطي ومضاعفات المصفوفة بسهولة. وتستفيد إطارات العمل مثل TensorFlow (الشائعة في التعلم العميق) بشكل كبير من الجبر الخطي في الداخل، مما يؤدي إلى تجريد التفاصيل منخفضة المستوى حتى يتمكن المستخدمون من التركيز على بناء النماذج.
هذه المقدمة الموجزة عن الجبر الخطي في سياق التعلم الآلي لا تفي الموضوع حقه، فالمفاهيم أوسع بكثير. وتصف مفاهيم مثل التحويل الخطي وتحويل المصفوفة كيف يمكن معالجة البيانات وإعادة تشكيلها، على سبيل المثال، تدوير صورة أو تحجيم سماتها. يُعد فهم أنواع المصفوفات، مثل مصفوفة الوحدة (التي تترك المتجهات دون تغيير عند ضربها بها، والمصفوفة المتعامدة (التي يكون معكوسها ببساطة هو منقولها) أمرًا مفيدًا أيضًا لتبسيط الحسابات. ورغم أن المرء لن يقوم عادةً بإجراء الحذف الغاوسي (خوارزمية لحل نظام المعادلات الخطية) يدويًا في التعلم الآلي، إلا إن فهم مبادئها يضيء كيفية حل هذه الأنظمة حسابيًا. ويُعد الاستقلال الخطي أمرًا بالغ الأهمية أيضًا لفهم تفرُّد الحلول وأساس الفضاء الاتجاهي (مجموعة كل التركيبات الخطية الممكنة لمجموعة من المتجهات).
في نهاية المطاف، فإن الفهم القوي لمفاهيم الجبر الخطي يُمكِّن ممارسى التعلم الآلي ليس فقط من استخدام خوارزميات التعلم الآلي المبنية مسبقًا ولكن يساعدهم أيضًا على فهم طريقة عملها الداخلية بشكل حقيقي، وتصحيحها بشكل فعال، بل وتطوير حلول جديدة. فهو الجندي المجهول الذي قاد جهود التعلم الآلي الشاقة لعقود من الزمن، دون أن يكون محط الأضواء، ولا يزال مستمرًا في مستقبل الذكاء الاصطناعي.
تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.
استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.
أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.