كل واحد من هذه الروابط العديدة بين الخلايا العصبية يُضرب في وزن فريد، يعمل على تضخيم أو تقليل تأثير كل ارتباط. ويمكن فهم الإدخال المقدم إلى دالة التنشيط لكل خلية عصبية على أنها المجموع المرجح لمخرجات كل خلية عصبية في الطبقة السابقة. وعادةً ما يُضاف أيضًا مصطلح تحيّز لكل دالة تشيط، يعمل بطريقة مشابهة لمصطلح التحيّز في دوال الانحدار التقليدية.
في أثناء التدريب، الشبكة العصبية "تتعلم" من خلال إجراء تعديلات على كل من هذه الأوزان وحدود التحيز التي تنتج مخرجات أكثر دقة. هذه هي معلمات النموذج: عندما تقرأ، على سبيل المثال، عن نموذج لغوي كبير (LLM) يحتوي على 8 مليارات "معلمة"، فإن هذا الرقم يعكس كل ارتباط مرجح بين الخلايا العصبية والتحيز الخاص بالخلايا العصبية في الشبكة العصبية للنموذج.
أما الطبقات الوسيطة، التي تُسمَّى الطبقات المخفية في الشبكة، فهي المكان الذي يحدث فيه معظم التعلم. إن تضمين طبقات مخفية متعددة هو ما يميز نموذج التعلم العميق عن الشبكة العصبية "غير العميقة"، مثل آلة بولتزمان المقيدة (RBN) أو المستقبِل متعدد الطبقات القياسي (MLP). يسمح وجود طبقات مخفية متعددة لنموذج التعلم العميق بتعلّم الميزات الهرمية المعقدة للبيانات، حيث تحدد الطبقات الأولى الأنماط الأوسع نطاقًا والطبقات الأعمق الأنماط الأكثر دقة.
لإجراء الاستدلال، تكمل الشبكة تمريرة أمامية: تتلقى طبقة الإدخال بيانات الإدخال، عادةً في شكل تضمين متجه، بحيث تقوم كل خلية في طبقة الإدخال بمعالجة سمة واحدة من سمات هذا المتجه. على سبيل المثال، النموذج الذي يعمل مع صور ذات تدرج رمادي 10 × 10 بكسل سيحتوي عادةً على 100 خلية عصبية في طبقة الإدخال الخاصة به، مع كل خلية عصبية مدخلة تقابل بكسل فرديًا. وبالتالي، تتطلب الشبكات العصبية عادةً أن تكون متجهات الإدخال ثابتة بحجم معين، على الرغم من أن تقنيات المعالجة المسبقة مثل التجميع أو التطبيع يمكن أن توفر بعض المرونة فيما يتعلق بحجم بيانات الإدخال الأصلية نفسها.
يتم تحويل البيانات تدريجيًا وتمريرها إلى عقد كل طبقة لاحقة حتى الطبقة النهائية. تحسب دوال تنشيط الخلايا العصبية في طبقة الإخراج التنبؤ النهائي إخراج الشبكة. على سبيل المثال، قد تقوم كل عقدة إخراج لنموذج تصنيف عميق بأداء دالة softmax التي تأخذ في الأساس مدخلات رقمية وتقيسها إلى احتمالية، بين 0-1، بأن المدخلات تنتمي إلى فئة تصنيف محتملة. ثم يقوم النموذج بإخراج الفئة المقابلة للعقدة التي تعطي أعلى مخرجات.