الشبكة العصبية هي نموذج تعلم آلي يقوم بتكديس "خلايا عصبية" بسيطة في طبقات ويتعلم أوزان التعرف على الأنماط والتحيزات من البيانات لتعيين الإدخالات إلى المخرجات.
تُعد الشبكات العصبية من بين الخوارزميات الأكثر تأثيرًا في التعلم الآلي الحديث والذكاء الاصطناعي (AI). إنها تدعم الاختراقات في مجال رؤية الكمبيوتر، معالجة اللغة الطبيعية (NLP)، التعرف على الكلام، وعدد لا يحصى من التطبيقات في العالم الحقيقي والتي تتراوح من التنبؤ إلى التعرف على الوجه. في حين أن الشبكات العصبية العميقة (DNNs) اليوم تعمل على تشغيل أنظمة معقدة مثل المحولات والشبكات العصبية الالتفافية (CNNs)، فإن أصول الشبكات العصبية تعود إلى نماذج بسيطة مثل الانحدار الخطي وكيفية هضم الدماغ البشري ومعالجة واتخاذ القرار بشأن المعلومات المقدمة إليه.
على مستوى عالٍ، يأتي الإلهام للشبكات العصبية من الخلايا العصبية البيولوجية في الدماغ البشري، والتي تتواصل من خلال الإشارات الكهربائية. وفي عام 1943، اقترح وارن ماكولوتش ووالتر بيتس أول نموذج رياضي للخلية العصبية، ما يدل على أن الوحدات البسيطة يمكن أن تجري حساب الوظيفة. في وقت لاحق، في عام 1958، قدم فرانك روزنبلات البيرسيبترون، وهي خوارزمية مصممة لأداء التعرف على الأنماط. يُعد البيرسيبترون السلف التاريخي للشبكات العصبية الحالية: فهو في جوهره نموذج خطي ذو مخرجات محدودة. في القسم التالي، سنغوص في كيفية استعارة الشبكات العصبية الإلهام من الأدمغة البشرية لاتخاذ القرارات والتعرف على الأنماط.
يمكن فهم الشبكة العصبية من خلال مثال بسيط: كشف البريد العشوائي. يتم إدخال رسالة بريد إلكتروني إلى الشبكة، ويتم استخدام ميزات مثل كلمات أو عبارات مثل "جائزة" أو "نقود" أو "عزيزي" أو "فوز" كمدخلات. تعالج الخلايا العصبية المبكرة في الشبكة أهمية كل إشارة، بينما تجمع الطبقات اللاحقة هذه المعلومات في إشارات عالية المستوى تلتقط السياق والنغمة. ثم تقوم الطبقة الأخيرة بحساب احتمالية إذا ما كان البريد الإلكتروني غير مرغوب فيه، وإذا كانت هذه الاحتمالية عالية بما فيه الكفاية، يتم وضع علامة على البريد الإلكتروني. في جوهرها، تتعلم الشبكة كيفية تحويل الميزات الأولية إلى أنماط ذات مغزى واستخدامها لعمل تنبؤات.
هذه العملية مدعومة بمفهومين أساسيين: الأوزان والتحيزات. تعمل الأوزان مثل الأقراص التي تتحكم في مدى قوة تأثير كل إدخال على القرار - كلمة مثل "جائزة" قد تُعطى وزنًا أكبر من كلمة شائعة مثل "مرحبًا". التحيزات هي قيم مدمجة تعمل على تغيير عتبة القرار، ما يسمح للخلايا العصبية بالتنشيط حتى لو كانت الإدخالات نفسها ضعيفة. تحدد معلمات النموذج هذه معًا كيف تساهم كل خلية عصبية في الحساب الكلي. من خلال تعديل هذه القيم أثناء التدريب، تتعلم الشبكة تدريجيًا إجراء تنبؤات دقيقة - في هذه الحالة، إذا ما كان البريد الإلكتروني بريدًا مزعجًا أم لا.
رياضيًّا، تتعلم الشبكات العصبية وظيفة عن طريق تعيين متجه إدخال لتوقع الاستجابة إن ما يميز الشبكات العصبية عن خوارزميات التعلم الآلي التقليدية الأخرى هو بنيتها ذات الطبقات وقدرتها على إجراء تحويل غير خطي.
تتكون الشبكة العصبية من:
تمامًا مثل خوارزميات التعلم الآلي الأخرى، تتطلب الشبكة العصبية تدريبًا صارمًا لأداء جيد في الاختبار. لتدريب الشبكة، تقوم خلية عصبية واحدة بحساب:
حيث:
تمثّل دالة تنشيط في طبقة المخرجات التي تحوّل المجموعة الخطية لتناسب قرار الدالة. وباستخدام هذه البنية، يتم تحويل سمات الإدخال X إلى مخرجات Y، لتكون بمثابة نموذج تنبؤي للتعلم الآلي.
تأتي قوة الشبكات العصبية من قدرتها على تعلم الأوزان والتحيزات الصحيحة من البيانات. ويتم ذلك عن طريق مقارنة تنبؤ الشبكة إلى التسمية الحقيقية وقياس الخطأ باستخدام دالة خسارة. على سبيل المثال، في مهام التصنيف، قد تقيس الخسارة مدى بعد الاحتمال المتوقع عن الإجابة الصحيحة.
ولتقليل هذه الخسارة، تستخدم الشبكة خوارزمية تسمى الانتشار الخلفي. يتم تدريب الشبكة العصبية في أربع خطوات:
يتم تكرار هذه العملية عدة مرات على مجموعة البيانات التدريبية. ويساعد كل تمرير الشبكة على "ضبط" معطياتها الداخلية بحيث تقترب تنبؤاتها تدريجيًا من الإجابات الصحيحة. وبمرور الوقت، تتقارب الشبكة مع مجموعة من الأوزان والتحيزات التي تقلل من الخطأ وتعمم جيدًا على البيانات غير المرئية. الانتشار الخلفي، إلى جانب الانحدار التدرجي، هو المحرك الذي يجعل الشبكات العصبية تعمل، فهو يُمكِّن الشبكات التي تحتوي على ملايين (أو حتى المليارات) من المعلمات من تعلم أنماط ذات مغزى من مجموعات البيانات الضخمة.
ومع ذلك، على الرغم من الجهود التي يبذلها الممارسون لتدريب نماذج عالية الأداء، لا تزال الشبكات العصبية تواجه تحديات مماثلة لنماذج التعلم الآلي الأخرى، وأهمها الإفراط في التخصيص. عندما تصبح الشبكات العصبية معقدة بشكل مفرط مع وجود عدد كبير جدًا من المعلمات، فإن النموذج سيتكيف بشكل مفرط مع بيانات التدريب ويتنبأ بشكل سيئ. إن الإفراط في التخصيص هو مشكلة شائعة في جميع أنواع الشبكات العصبية، ويُعدُّ الاهتمام الوثيق بالمفاضلة بين التحيز والتباين أمرًا بالغ الأهمية لإنشاء نماذج شبكات عصبية عالية الأداء.
تتبع بنيات الشبكات العصبية الحديثة - مثل المحولات ونماذج التشفير/فك التشفير - المبادئ الأساسية نفسها (الأوزان والتحيزات المكتسبة، والطبقات المكدسة، وعمليات التنشيط غير الخطية، والتدريب من طرف إلى طرف عن طريق الانتشار الخلفي). إنها تختلف بشكل أساسي في كيفية خلط المدخلات عبر الطبقات. وبدلُا من الخلط المتصل بالكامل وحده، تستخدم المحولات الاهتمام لتشكيل مجموعات مرجحة تعتمد على البيانات من التمثيلات، جنبًا إلى جنب مع الاتصالات المتبقية والتطبيع والترميزات الموضعية لتعزيز الربط المبني على الأسس الأساسية نفسها.
في حين أن البيرسيبترونات متعددة الطبقات هي الأساس، فقد تطورت الشبكات العصبية إلى بنى متخصصة تناسب مجالات مختلفة:
تشكل الشبكات العصبية الأساس للعديد من أنظمة الذكاء الاصطناعي اليوم. وتتضمن بعض التطبيقات البارزة للشبكات العصبية ما يلي:
تقود هذه التطبيقات الابتكارات في العالم الحقيقي في مجالات الرعاية الصحية والتمويل والتشغيل الآلي والترفيه وغيرها.
تتعلم الشبكات العصبية تمثيلات داخلية مفيدة مباشرةً من البيانات، وتلتقط البنية غير الخطية التي تفتقدها النماذج الكلاسيكية. وبفضل السعة الكافية والأهداف السليمة والتنظيم ضد الإفراط في التخصيص، فإنها تتوسع من معيار صغير إلى أنظمة الإنتاج في رؤية الكمبيوتر ومعالجة اللغة الطبيعية والتعرف على الكلام والتنبؤ والمزيد، ما يحقق مكاسب قابلة للقياس في الدقة والمتانة.
ويمتد التعلم العميق الحديث إلى هذه الأسس. تتخصص الشبكات العصبية الالتفافية في استخراج السمات المكانية للصور، بينما تقوم الشبكات العصبية المتكررة بنمذجة التبعيات الزمنية في التسلسلات، وتستبدل المحولات التكرار بالانتباه، بمساعدة الاتصالات المتبقية والتطبيع والتوازي الفعال على وحدات معالجة الرسوميات.
على الرغم من الاختلافات المعمارية، يظل التدريب من النهاية إلى النهاية مع الانتشار الخلفي على مجموعات البيانات الكبيرة، ولا تزال وجهة النظر الأساسية قائمة: يتم تعلم من خلال تكوين التحويلات التي تعتمد على البيانات مع عمليات التنشيط غير الخطية. ويعتمد الذكاء الاصطناعي التوليدي على المبادئ نفسها ولكن على نطاق أوسع. وتتعلم النماذج اللغوية الكبيرة ونماذج الانتشار ونماذج التشفير التلقائي المتغير والشبكات التنافسية التوليدية التوزيعات على البيانات لتجميع النص والصور والصوت والتعليمات البرمجية.
القفزة من البيرسيبترون متعدد الطبقات إلى أحدث المولِّدات تعتمد بشكل أساسي على البنية والبيانات والحوسبة. إن فهم دوال التنشيط ومتطلبات التدريب والأنواع الرئيسية للشبكات يوفر جسرًا عمليًا من الشبكات العصبية الكلاسيكية إلى الأنظمة التوليدية الحالية ويوضح لماذا أصبحت هذه النماذج أساسية في الذكاء الاصطناعي الحديث.
تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.
استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.
أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.