الشبكات العصبية

menu icon

الشبكات العصبية

تعكس الشبكات العصبية سلوك العقل البشري، مما يسمح لبرامج الحاسب الآلي بالتعرف على النماذج وحل المشاكل الشائعة في مجالات الذكاء الاصطناعي والتعلم الآلي والتعلم العميق.

ما هي الشبكات العصبية؟

الشبكات العصبية، والمعروفة أيضا باسم الشبكات العصبية الاصطناعية (ANN) أو الشبكات العصبية المحاكاة (SNNs)، هي مجموعة فرعية من التعلم الآلي وتقع في قلب خوارزميات التعلم العميق. اسمها وهيكلها مستوحى من الدماغ البشري، حيث أنها تحاكي الطريقة التي ترسل بها الخلايا العصبية البيولوجية الرسائل إلى بعضها البعض.

تتكون الشبكات العصبية الاصطناعية (ANNs) من طبقات من العقد، حيث تحتوي على طبقة للمدخلات، وطبقة مخفية واحدة أو أكثر، وطبقة للمخرجات. كل عقدة، أو خلية عصبية اصطناعية، ترتبط بأخرى ويكون لها حمل وحد مرتبطين بها. إذا كانت مخرجات أي عقدة فردية أعلى من قيمة الحد المحددة، فانه يتم تفعيل هذه العقدة، وإرسال البيانات إلى الطبقة التالية من الشبكة. خلاف ذلك، لن يتم تمرير أي بيانات إلى الطبقة التالية من الشبكة.

رسم بياني بصري لطبقة المدخلات والطبقات الخفية وطبقة المخرجات في شبكة عصبية تعتمد على التغذية الأمامية

تعتمد الشبكات العصبية على بيانات التدرب لكي تتعلم وتحسن من دقتها بمرور الوقت. ومع ذلك، بمجرد ضبط خوارزميات التعلم هذه بدقة، فهي تعد أدوات قوية في علوم الحاسب والذكاء الاصطناعي، مما يسمح لنا بتصنيف البيانات وتجميعها بسرعة عالية. قد تستغرق المهام الخاصة بإمكانية التعرف على الكلام أو إمكانية التعرف على الصور دقائق في مقابل ساعات عند مقارنتها بالتعريف اليدوي من قبل الخبراء البشريين. واحدة من أكثر الشبكات العصبية المعروفة هي خوارزمية Google للبحث.

كيف تعمل الشبكات العصبية؟

فكر في كل عقدة على أنها نموذج انحدار خطي خاص بها، يتكون من بيانات المدخلات والأوزان والميل (أو الحد) والمخرجات. ستبدو المعادلة كالتالي:

معادلة رياضية تستخدم لتحديد المجموع

‎∑wixi + bias = w1x1 + w2x2 + w3x3 + bias‎

معادلة رياضية يتم استخدامها لتحديد المخرجات

‎output = f(x) = 1 if ∑w1x1 + b> = 0; 0 if ∑w1x1 + b < 0‎

بمجرد تحديد طبقة المدخلات، يتم تخصيص الأوزان. تساعد هذه الأوزان في تحديد أهمية أي متغير تم تحديده، حيث يكون للكبير منها مساهمة أكبر في المخرجات مقارنة بالمدخلات الأخرى. يتم ضرب كل المدخلات بعد ذلك في أوزان كل منها ثم يتم جمعها. بعد ذلك، يتم تمرير المخرجات من خلال دالة التفعيل، التي تقوم بتحديد المخرجات. إذا كانت هذه المخرجات تتجاوز الحد المحدد، فإنها تقوم "بإطلاق" (أو بتفعيل) العقدة، وذلك بتمرير البيانات إلى الطبقة التالية في شبكة الاتصال. نتيجة لذلك، تصبح المخرجات الخاصة بعقدة ما متواجدة في مدخلات العقدة التالية. عملية تمرير البيانات من طبقة إلى الطبقة التالية تضع تعريفا لهذه الشبكة العصبية كشبكة تعتمد على التغذية الأمامية.

دعنا نحلل كيف تبدو العقدة الواحدة باستخدام القيم الثنائية. يمكننا تطبيق هذا المفهوم على مثال أكثر واقعية، مثل ما إذا أن تذهب لممارسة ركوب الأمواج (نعم: 1، لا: 0). قرار الذهاب أو عدم الذهاب هو النتيجة المتوقعة لدينا، أو y-hat. دعنا نفترض أن هناك ثلاثة عوامل تؤثر على اتخاذك للقرار:

  1. هل حالة الأمواج جيدة؟ (نعم: 1، لا: 0)
  2. هو صف انتظار الأمواج خالي؟ (نعم: 1، لا: 0)
  3. هل وقع هجوم من قرش مؤخرا؟ (نعم: 0، لا: 1)

إذا، دعنا نفترض ما يلي، مما يعطينا المدخلات الآتية:

  • X1 = ‏1، بما أن الأمواج تتلاطم
  • X2 = ‏0، بما أن الجموع قد خرجت
  • X3 = ‏1، بما أنه لم يقع هجوم لقرش مؤخرا

الآن، نحن بحاجة إلى تخصيص بعض الأوزان لتحديد الأهمية. الأوزان الأكبر تدل على أن هناك متغيرات معينة لها أهمية أكبر للقرار أو النتيجة.

  • W1 = ‏5، بما أن الأمواج عالية الارتفاع لا تحديث كثيرا
  • W2 = ‏2، بما أنك معتاد على الازدحام
  • W3 = ‏4، بما أن لديك خوف من أسماك القرش

وأخيرا، سنفترض أيضا أن قيمة الحد هي 3، والتي قد تترجم إلى قيمة ميل تبلغ ‎–3. مع كل المدخلات المختلفة، يمكننا البدء في إدخال القيم في المعادلة للحصول على المخرجات المطلوبة.

Y-hat = (1*5) + (0*2) + (1*4) – 3 = 6

إذا قمنا باستخدام دالة التفعيل من بداية هذا القسم، فيمكننا تحديد أن مخرجات هذه العقدة ستكون 1، بما أن 6 أكبر من 0. في هذا المثال، يمكنك ممارسة ركوب الأمواج؛ ولكن إذا قمنا بتعديل الأوزان أو الحد، يمكننا أن نحقق نتائج مختلفة عن النموذج. عندما نلاحظ أحد القرارات، كما في المثال أعلاه، يمكننا أن نرى كيف يمكن للشبكة العصبية أن تصنع قرارات أكثر تعقيدا باعتمادها على مخرجات القرارات أو الطبقات السابقة.

في المثال أعلاه، استخدمنا المستقبلات لتوضيح بعض الرياضيات هنا، ولكن الشبكات العصبية تستفيد من الخلايا العصبية السينية، التي تتميز بالقيم بين 0 و 1. بما أن الشبكات العصبية تتصرف على نحو مماثل لمخطط تسلسل القرارات، فإن توصيل البيانات بشكل تعاقبي من عقدة إلى أخرى، ووجود عدد ما من القيم بين 0 و 1، سيقلل من الأثر الذي يسببه أي تغيير محدد يطرأ بمتغير واحد على مخرجات أي عقدة محددة، ومن ثم مخرجات الشبكة العصبية.

بينما نبدأ في التفكير في المزيد من حالات الاستخدام العملي للشبكات العصبية، مثل إمكانية التعرف على الصور أو تصنيفها، فإننا سوف نستفيد من التعلم تحت الإشراف، أو فئات البيانات ذات التسمية، لتدريب الخوارزمية. بينما نقوم بتدريب النموذج، سنرغب في تقييم دقته باستخدام دالة التكلفة (أو الخسارة). يشار إلى هذا أيضا عادة بمتوسط مربعات الأخطاء (MSE). في المعادلة أدناه،

  • i تمثل مؤشر العينة،
  • y-hat هي النتيجة المتوقعة،
  • y هي القيمة الفعلية، و
  • m هي عدد العينات.
معادلة رياضية يتم استخدامها لتحديد دالة التكلفة

𝐶𝑜𝑠𝑡 𝐹𝑢𝑛𝑐𝑡𝑖𝑜𝑛 = 𝑀𝑆𝐸 =1/2𝑚 ∑129_(𝑖 =1)^𝑚▒(𝑦 ̂^((𝑖) )−𝑦^((𝑖) ) )^2

في النهاية، فإن الهدف هو تصغير حجم دالة التكلفة لدينا لكي نضمن أن تكون ملائمة لأي رصد أو ملاحظة مقدمة. بينما يقوم النموذج بتعديل أوزانه وميله، فإنه يستخدم دالة التكلفة والتعلم المعزز للوصول إلى نقطة التقارب، أو الحد الأدنى المحلي. العملية التي تقوم فيها الخوارزمية بتعديل أوزانها تكون من خلال النزول المتدرج، مما يسمح للنموذج بتحديد اتجاهه نحو تقليل الأخطاء (أو تصغير دالة التكلفة). مع كل نموذج تدريبي، يتم ضبط معاملات النموذج لتتقارب تدريجيا عند الحد الأدنى.

رسم بياني خطي يوضح نقطة التقارب

راجع مقالة IBM Developer للحصول على شرح أعمق للمفاهيم الكمية المتضمنة في الشبكات العصبية.

إن معظم الشبكات العصبية العميقة تعتمد على التغذية الأمامية، مما يعني أنها تتدفق في اتجاه واحد فقط، من المدخلات إلى المخرجات. ومع ذلك، يمكنك أيضا تدريب النموذج الخاص بك من خلال الانتشار الخلفي؛ أي النقل في الاتجاه المعاكس من المخرجات إلى المدخلات. يسمح لنا الانتشار الخلفي باحتساب الخطأ الملحق بكل خلية عصبية وإسناده، مما يسمح لنا بضبط وملائمة المعاملات الخاصة بالنموذج (النماذج) بطريقة صحيحة.

أنواع الشبكات العصبية

يمكن تصنيف الشبكات العصبية إلى أنواع مختلفة، والتي يتم استخدامها لأغراض مختلفة. في حين أن هذه ليست قائمة شاملة تضم كل الأنواع، فإن ما يلي يمثل أشهر أنواع الشبكات العصبية التي سوف تمر عليها بسبب حالات الاستخدام الشائعة لها:

المستقبل هو أقدم أنواع الشبكات العصبية، أنشأه فرانك روزنبلات في عام 1958. لديه خلية عصبية واحدة وهي أبسط شكل من أشكال الشبكات العصبية:

رسم بياني بسيط لمُستقبِل باستخدام خطوط ودائرة زرقاء

الشبكات العصبية القائمة على التغذية الأمامية، أو المستقبلات ذات الطبقات المتعددة (MLPs)، هي ما ركزنا عليه في المقام الأول في هذه المقالة. وهي تتكون من طبقة مدخلات، طبقة أو طبقات مخفية، وطبقة مخرجات. في حين أن هذه الشبكات العصبية يشار إليها عادة باسم MLPs، فمن المهم أن نلاحظ أنها تتكون فعليا من خلايا عصبية سينية، وليس مستقبلات، لأن معظم المشاكل في العالم الحقيقي غير خطية. عادة ما يتم إدخال البيانات في هذه النماذج لتدريبها، وهي الأساس لرؤية الحاسب ومعالجة اللغة الطبيعية والشبكات العصبية الأخرى.

تتشابه الشبكات العصبية الملتفة (CNNs)، مع شبكات التغذية الأمامية، ولكن يتم استخدامها عادة للتعرف على الصور و/أو التعرف على النماذج و/أو رؤية الحاسب الآلي. تعمل هذه الشبكات على تطويع المبادئ من الجبر الخطي، ولا سيما عمليات ضرب المصفوفات، لتحديد النماذج في الصورة.

يتم تعريف الشبكات العصبية المتكررة (RNNs) من خلال حلقات التغذية المرتجعة الخاصة بهم. يتم استخدام خوارزميات التعلم تلك في المقام الأول عند استخدام بيانات السلاسل الزمنية لتوقع النتائج المستقبلية، مثل توقعات سوق الأسهم أو التنبؤ بالمبيعات.

الشبكات العصبية مقابل التعلم العميق

عادة ما يتم استخدام مصطلحي التعلم العميق والشبكات العصبية على نحو متبادل في الحديث، وهو ما قد سوء الفهم. نتيجة لذلك، تجدر الإشارة إلى أن كلمة "عميق" في مصطلح التعلم العميق تشير فقط إلى عمق الطبقات في الشبكة العصبية. الشبكة العصبية التي تتكون من أكثر من ثلاث طبقات - والتي ستكون شاملة للمدخلات والمخرجات - يمكن اعتبارها خوارزمية للتعلم العميق. الشبكة العصبية التي لديها فقط طبقتين أو ثلاث طبقات هي مجرد شبكة عصبية أساسية.

لمعرفة المزيد حول الاختلافات بين الشبكات العصبية وأشكال الذكاء الاصطناعي الأخرى، مثل التعلم الآلي، يرجى قراءة منشور المدونة "الذكاء الاصطناعي مقابل التعلم الآلي مقابل التعلم العميق مقابل الشبكات العصبية: ما الفرق؟"

تاريخ الشبكات العصبية

يرجع تاريخ الشبكات العصبية إلى ما هو أقدم مما يعتقده معظم الناس. في حين أن فكرة "الآلة التي تفكر" يمكن أن ترجع إلى الإغريق القدماء، سوف نركز على الأحداث الرئيسية التي أدت إلى تطور التفكير حول الشبكات العصبية، التي انحسرت شعبيتها وازدادت على مر السنين:

1943: قام وارن س.مكلوتش ووالتر بيتس بنشر "A logical calculus of the ideas immanent in nervous activity (PDF‏، 1 ميجابايت) ‏(الرابط يوجد خارج IBM)" حيث سعى هذا البحث إلى فهم كيف يمكن للدماغ البشري إنتاج نماذج مركبة من خلال خلايا الدماغ المتصلة، أو الخلايا العصبية. واحدة من الأفكار الرئيسية التي خرجت من هذا العمل هي مقارنة بين الخلايا العصبية ذات الحد الثنائي بالمنطق البوولي (أي، 0/1 أو عبارات الصحيح/الخطأ).

1958: يرجع الفضل لفرانك روزنبلات في تطوير نموذج المُستقبِل Perceptron، والموثق في بحثه، "المُستقبِل: هو نموذج احتمالي لتخزين المعلومات وتنظيمها في الدماغ" (نسخة PDF،‏ 1.6 ميجابايت) (يوجد الرابط خارج IBM). فهو يتقدم بعمل ماكولوتش وبيتس خطوة أبعد من خلال ادخال الأوزان في المعادلة. بالاستفادة من IBM 704، تمكن روزنبلات من جعل جهاز حاسب آلي يتعلم كيفية تمييز البطاقات التي تم تعليمها على اليسار مقابل البطاقات التي تم تعليمها على اليمين.

1974: في حين أن العديد من الباحثين أسهموا في فكرة الانتشار الخلفي، كان بول ويربوس أول شخص في الولايات المتحدة يشير إلى تطبيقه في الشبكات العصبية في رسالة الدكتوراه الخاصة به (نسخة PDF،‏ 8.1 ميجابايت) (يوجد الرابط خارج IBM).

1989: نشر يان ليكان ورقة بحثية (نسخة PDF،‏ 5.7 ميجابايت) (يوجد الرابط خارج IBM) توضح كيفية استخدام القيود في الانتشار الخلفي وتكاملها في بنية الشبكة العصبية من أجل تدريب الخوارزميات. نجح هذا البحث في الاستفادة من واحدة من الشبكات العصبية للتعرف على أرقام الرمز البريدي المكتوبة بخط اليد التي قدمتها خدمة البريد الأمريكية.

الشبكات العصبية وIBM Cloud

لعقود من الزمن، كانت IBM رائدة في تطوير تقنيات الذكاء الاصطناعي والشبكات العصبية، والتي من أبرزها تطوير ونمو IBM Watson. ‏Watson الآن هو حل موثوق به للمؤسسات التي تتطلع إلى تطبيق تقنيات معالجة متطورة للغات الطبيعية والتعلم العميق على أنظمتها باستخدام منهج متدرج أثبت فاعليته لاعتماد الذكاء الاصطناعي وتجهيزه.

يقوم Watson باستخدام إطار عمل Apache Unstructured Information Management Architecture (UIMA) وبرنامج DeepQA المقدم من IBM لجعل الإمكانيات القوية للتعلم العميق متاحة للتطبيقات. باستخدام أدوات مثل IBM Watson Studio، تستطيع مؤسستك البدء بسلاسة في إنتاج مشروعات الذكاء الاصطناعي ذات المصدر المفتوح أثناء نشر وتشغيل النماذج بأي بيئة سحابية.

لمزيد من المعلومات عن كيفية البدء باستخدام تقنية التعلم العميق، يمكنك استكشاف IBM Watson Studio وخدمة التعلم العميق.

يجب التسجيل للحصول على IBMid وإنشاء حساب IBM Cloud الخاص بك.