قبل التعمق في الانحدار التدرجي، قد يكون من المفيد مراجعة بعض المفاهيم من الانحدار الخطي. الصيغة الشهيرة لمعادلة الخط المستقيم هي: y = mx + b، حيث m تمثل الميل، وb تمثل الجزء المقطوع من المحور y.
قد تتذكر أيضًا رسم مخطط التبعثر في الإحصائيات وتحديد خط الانحدار الأفضل، الذي يتطلب حساب الخطأ بين المخرجات الفعلية والمخرجات المتوقعة (y-hat) باستخدام معادلة متوسط مربع الخطأ. تعمل خوارزمية الانحدار التدرجي بطريقة مشابهة، لكنها تعتمد على دالة محدبة.
تُعَد نقطة البداية مجرد نقطة عشوائية نستخدمها لتقييم الأداء. من تلك النقطة، سنحسب المشتقة (أو الميل)، ومن خلالها يمكننا استخدام خط المماس لتحديد مدى انحدار الميل. سيعمل المنحدر على إبلاغ التحديثات على مَعلمات النموذج - أي الأوزان والتحيز. سيكون الميل عند نقطة البداية أكثر انحدارًا، ولكن مع توليد مَعلمات جديدة، يجب أن يقلّ الانحدار تدريجيًا حتى يصل إلى النقطة الأدنى على المنحنى، والمعروفة بنقطة التقارب.
وعلى نحو مشابه لإيجاد خط أفضل مطابقةً في الانحدار الخطي، فإن هدف الانحدار التدرّجي هو تقليل دالة التكلفة، أو الخطأ بين القيم المتوقعة والفعلية للقيمة y. وكي يتم ذلك، يتطلب الأمر نقطتين من البيانات، اتجاهًا ومعدل تعلُّم. وتحدِّد هذه العوامل الحسابات المشتقة الجزئية للتكرارات المستقبلية، ما يُتيح لها الوصول تدريجيًا إلى الحد الأدنى المحلي أو العالمي (أي نقطة التقارب).
- معدل التعلم (الذي يُشار إليه أيضًا بحجم الخطوة أو ألفا) هو حجم الخطوات التي يتم اتخاذها للوصول إلى الحد الأدنى. عادةً ما تكون هذه القيمة صغيرة، ويتم تقييمها وتحديثها بناءً على سلوك دالة التكلفة. تؤدي معدلات التعلم العالية إلى خطوات أكبر، ولكنها تعرِّض لخطر تجاوز الحد الأدنى. بالمقابل، معدل التعلم المنخفض له أحجام خطوات صغيرة. رغم أن له ميزة الدقة الأفضل، فإن عدد التكرارات يؤثِّر في الكفاءة العامة؛ لأنه يتطلب وقتًا وحسابات إضافية للوصول إلى الحد الأدنى.
- تقيس دالة التكلفة (أو الخسارة) الفرق، أو الخطأ، بين y الفعلية وy المتوقعة في موضعها الحالي. يعمل هذا على تحسين فاعلية نموذج التعلم الآلي من خلال توفير التعليقات للنموذج بحيث يمكنه ضبط المَعلمات لتقليل الخطأ وإيجاد الحد الأدنى المحلي أو العالمي. يستمر في التكرار باستمرار، متحركًا في اتجاه الانحدار الأكثر حدة (أو المشتقة السالبة) حتى تصبح دالة التكلفة قريبة من الصفر أو تصل إليها. في هذه المرحلة، سيتوقف النموذج عن التعلم. بالإضافة إلى ذلك، بينما يُعدُّ مصطلحا دالة التكلفة ودالة الخسارة مترادفين، هناك فرق طفيف بينهما. تجدر الإشارة إلى أن دالة الخسارة تُشير إلى الخطأ في مثال تدريبي واحد، بينما تحسب دالة التكلفة متوسط الخطأ عبر مجموعة التدريب بأكملها.