تعد نمذجة الانحدار الذاتي إحدى طرق التعلم الآلي الأكثر استخدامًا لتحليل السلاسل الزمنية والتنبؤ بها، ولا تستخدم إلا قيمة واحدة أو أكثر، من القيم المحصول عليها من الخطوات الزمنية السابقة في سلسلة زمنية لإنشاء انحدار.
فهي طريقة بسيطة لكنها قوية لتحليل السلاسل الزمنية؛ وتوفر تنبؤات فعالة وقابلة للتفسير بدرجة كبيرة ما دامت بياناتك تحتوي على ترابطات في الخطوات الزمنية. ويسمى الترابط عبر الخطوات الزمنية بالترابط الذاتي لأنه مقياس لمدى ترابط القيمة بنفسها. حيث إن العملية الخطية البحتة سترتبط تلقائيًا بنفسها عبر السلسلة الزمنية، مما يجعل من الممكن التنبؤ بالقيمة التالية تمامًا من القيم السابقة باستخدام عملية الانحدار الذاتي. إن العملية العشوائية تمامًا مثل البيانات المشوشة لن يكون لها ترابط ذاتي لأننا لا نستطيع التنبؤ بالقيم الحالية أو المستقبلية باستخدام القيم السابقة.
السلسلة الزمنية هي سلسلة من القياسات لنفس المتغير أو مجموعة المتغيرات التي يتم إجراؤها بمرور الوقت. يتم إجراء القياسات عادةً في أوقات متباعدة بشكل متساوٍ، على سبيل المثال كل ساعة أو شهرية أو سنوية. على سبيل المثال، قد تكون لدينا قيم تقيس عدد ركاب الخطوط الجوية في بلد ما، مع ملاحظة القياسات كل شهر. في هذه الحالة، يمثل y عدد الركاب المقاس ويؤكد على وجود قيم مقاسة بمرور الوقت. يتم تطبيق قيمة t كرمز سفلي بدلاً من i المعتاد للإشارة إلى أن yt تمثل قيمة y في أي وقت.
نموذج الانحدار الذاتي هو عندما نتراجع قيمة من سلسلة زمنية إلى قيم سابقة من نفس السلسلة الزمنية. على سبيل المثال، يستخدم yt المتراجع في yt-1 القيمة السابقة لـ y، والتي تسمى القيمة المتأخرة (الإبطاء)، للتنبؤ بالقيمة الحالية لـ y. في نموذج الانحدار البسيط هذا، أصبح المتغير التابع في الفترة الزمنية السابقة هو متغير التوقع. تمثل الأخطاء جميع الافتراضات المعتادة حول الأخطاء في نموذج الانحدار الخطي البسيط. غالبًا ما ننظر إلى ترتيب الانحدار الذاتي باعتباره عدد القيم السابقة في السلسلة المستخدمة للتنبؤ بالقيمة الآن. لذا، فإن yt المتراجع على yt-1 هو انحدار ذاتي من الدرجة الأولى، ويُكتب بالشكل التالي AR(1).
في الانحدار الخطي المتعدد، كان ناتج الانحدار عبارة عن مجموعة خطية من متغيرات إدخالات متعددة. أما في نماذج الانحدار الذاتي، فيكون الإخراج هو نقطة البيانات المستقبلية المعبَّر عنها كمجموعة خطية لعدد p من نقاط البيانات السابقة. p هو عدد المتغيرات المتباطئة المدرَجة في المعادلة. يتم تعريف نموذج AR(1) رياضيًا بالشكل التالي:
xt-1 هي قيمة السلسلة السابقة من متغير متباطئ واحد بالخلف
ϕ هو المعامل المحسوب لهذا المتغير المتباطئ
Alphat هي بيانات مشوشة (كالقيم العشوائية مثلاً)
يتم تعريف دلتا على أنها
بالنسبة لنموذج الانحدار الذاتي من الدرجة p، حيث p هو العدد الإجمالي للمتغيرات المشتركة المحسوبة للمتغيرات المتباطئة و μ هو متوسط العملية.
وعند إضافة مزيد من المتغيرات المتباطئة إلى النموذج، فإننا نضيف مزيدًا من المعاملات ومتغيرات التباطؤ إلى المعادلة:
النموذج السابق هو انحدار ذاتي من الدرجة الثانية لأنه يحتوي على متغيرين اثنين من متغيرات التباطؤ.
الشكل العام لمعادلة الانحدار الذاتي لـ p الخاص بالترتيب هو
لاستخدام نماذج الانحدار الذاتي للتنبؤ بسلاسل زمنية، نستخدم القيمة الزمنية الحالية وأي بيانات تاريخية للتنبؤ بالخطوة الزمنية التالية. على سبيل المثال، نموذج AR الذي يحتوي على 2 من المتغيرات المتباطئة قد يتنبأ بخطوة زمنية واحدة للأمام كما يلي:
من أكثر الأساليب شيوعًا لحساب المعامِلات لكل متغير متباطئ إما تقدير الاحتمالية القصوى (MLE) أو التقدير الذي يستخدم طريقة المربعات الصغرى (OLS). ونفس القيود التي تواجهها هذه الأساليب عند إعداد نموذج انحدار خطي موجودة عند إعداد نماذج الانحدار الذاتي أيضًا. وحسب ما إذا كنت تستخدم Python أو R والمكتبة، يمكنك استخدام إما أساليب Yule-Walker أو Burg بالإضافة إلى MLE أو OLS.
تُتيح العديد من المكتبات للمستخدمين تحديد المعايير التي سيتم استخدامها عند اختيار النماذج من جميع النماذج المرشحة. على سبيل المثال، قد تريد استخدام معامِلات النموذج لتقليل معيار معلومات Aikike أو معايير المعلومات الافتراضية حسب حالة الاستخدام والبيانات الخاصة بك.
الارتباط الذاتي يحسب الترابط بين سلسلة زمنية وبين نسخة منها ذات متغير متباطئ. الفارق هو عدد الوحدات الزمنية لتحويل السلسلة الزمنية. حيث يقوم المتغير المتباطئ 1 بمقارنة السلسلة بخطوة زمنية سابقة. بينما المتغير المتباطئ 2 يقارنها بالخطوة الزمنية التي تسبق تلك الخطوة. درجة الارتباط الذاتي عند متغير متباطئ معين تُظهر الاعتماد الزمني للبيانات. فعندما يكون الارتباط الذاتي مرتفعًا، تكون هناك علاقة قوية بين القيمة الحالية وبين القيمة عند ذلك المتغير المتباطئ. أما عندما يكون الارتباط الذاتي منخفضًا أو قريبًا من الصفر، فهذا يشير إلى وجود علاقة ضعيفة أو عدم وجود علاقة على الإطلاق.
من الطرق الشائعة لتمثيل الارتباط الذاتي هو حساب دالة الارتباط الذاتي (ACF) أو مخطط ACF الذي يعرض معامِلات الارتباط الذاتي في فترات زمنية مختلفة.
حيث المحور الأفقي يمثل المتغير المتباطئ، بينما يمثل المحور الرأسي قيم الارتباط الذاتي. يمكن أن تكشف القمم أو الأنماط الكبيرة في مخطط ACF عن البنية الزمنية الأساسية للبيانات. وغالبًا ما يعتمد اختيار ترتيب التأخير (p) في نموذج AR على تحليل رسم ACF. في نموذج AR(p)، يتم التعبير عن القيمة الحالية للسلسلة الزمنية كمجموعة خطية لقيم p السابقة، مع معاملات يتم تحديدها من خلال طريقة المربعات الصغرى العادية أو الحد الأقصى للانحراف المعياري. ويتم استخدام الارتباط التلقائي أيضًا لتقييم إذا ما كانت السلسلة الزمنية ثابتة أم لا. في حالة السلسلة الزمنية الثابتة، يجب أن ينخفض الارتباط التلقائي تدريجيًا مع زيادة المتغير المتباطئ ولكن إذا لم يُشِر مخطط ACF إلى انخفاض، فقد تحتوي البيانات على عدم ثبات. ويمكنك معرفة المزيد عن الارتباط الذاتي هنا.
توجد عدة أشكال مختلفة لنموذج السلسلة الزمنية ذاتية الانحدار القياسية التي تعالج التحديات وأوجه القصور التي تقابل هذا النموذج.
يعمل النموذج الإحصائي البسيط للانحدار الذاتي باستخدام مجموعات البيانات أحادية المتغير، مما يعني أن مجموعة البيانات يجب أن تحتوي على قيمة واحدة لكل فترة. وقد تم تطوير نماذج متجهات الانحدار الذاتي (VAR) للسماح بالانحدار الذاتي للسلاسل الزمنية متعددة المتغيرات. ويتم تنظيم ترتيبها بحيث يكون كل متغير بمثابة دالة خطية للمتغيرات المتباطئة السابقة لنفسه وللمتغيرات المتباطئة السابقة للمتغيرات الأخرى. افترض أن لديك سلسلة زمنية مكونة من قياسين مختلفين، الأول هو العدد الشهري لرحلات الطيران، والثاني هو العدد الشهري لرحلات القطار بين المدن. في نموذج VAR، يمكنك أن تتنبأ بقيمة استخدام كليهما بعمل انحدار لكل منهما يتضمن القيمة الأخرى. عند ترميز الرحلات البرية باستخدام القطار كـ Xr والرحلات الجوية بالطائرة كـ Xa، سيكون لدينا:
قد تواجه نماذج الانحدار الذاتي البسيطة صعوبات مع السلاسل الزمنية التي لها اتجاه قوي. ويوجد نوعان شائعان من نماذج الانحدار الذاتي؛ هما نموذج المتوسط المتحرك الانحداري الذاتي (ARMA) ونموذج المتوسط المتحرك الانحداري الذاتي المتكامل (ARIMA). وتُعَد هذه التغايرات مفيدة بشكل خاص عندما يكون للبيانات اتجاه قوي. كما تُعَد نمذجة المتوسط المتحرك طريقة أخرى للتنبؤ ببيانات السلاسل الزمنية، ويقوم نموذج ARIMA بدمج هاتين الطريقتين، وهذا سبب تسميته. هناك أيضًا تغايرات في نماذج ARIMA. ومن أشهر الامتدادات الشائعة لهذه النماذج نموذج ARIMA للمتجهات (اختصاره VARIMA)، الذي يُستخدم عندما تكون البيانات متعددة المتغيرات. وهناك امتداد آخر شائع وهو نموذج ARIMA الموسمي (اختصاره SARIMA) والذي يُستخدم عندما تحتوي البيانات على قيم موسميّة قوية. يمكنك قراءة المزيد عن نماذج ARIMA هنا.
تعمل نماذج الانحدار الذاتي بشكل أكثر موثوقية عندما تكون بيانات السلاسل الزمنية ثابتة ولا يتغير التباين عبر السلاسل الزمنية. وفي كثير من الأحيان يتم التفريق بين البيانات غير الثابتة عن طريق الزمن لإزالة التغييرات في التباين ومن ثم ملاءمة نموذج AR. وفي بعض الأحيان يكون هذا التباين مهمًا وذا مغزى ويرغب عالِم البيانات في تركه موجودًا. توفر طريقة الانحدار الذاتي المشروط بعدم ثبات التباين (ARCH) طريقة لنمذجة التغيير في التباين في سلسلة زمنية تعتمد على الوقت، مثل زيادة أو نقصان تقلب البيانات. ويوجد امتداد لهذا النهج، يُعرف باسم الانحدار الذاتي المشروط المتغاير (GARCH)، يسمح لهذه الطريقة بدعم التغيرات في تقلب البيانات المعتمد على الوقت. على سبيل المثال، عند زيادة وانخفاض تقلب البيانات في نفس السلسلة.
عندما تكون هناك عملية غير عشوائية للتغيرات في تباينات السلاسل الزمنية، يمكن أن تستخدم خوارزمية الانحدار الذاتي المشروط بعدم ثبات التباين ( خوارزمية ARCH) أساليب الانحدار الذاتي لنمذجة التغيرات الحادثة في تقلب مجموعة البيانات والتنبؤ بها. ولا تمثل نماذج الانحدار الذاتي المنتظمة نموذجًا للتغيير في التباين في مجموعة البيانات. لهذا السبب، قد يستخدم عالِم البيانات التحويلة الرياضية "بوكس كوكس" لتقليل التباين في مجموعة البيانات. ومع ذلك، إذا كان التغيير في التباين مرتبطًا تلقائيًا، فيمكن أن يوفر نهج ARCH للنمذجة تنبؤات بشأن الوقت الذي قد تبدأ فيه العملية في التغيير. هذا النهج يُعرف باسم التنبؤ بتقلب البيانات ويُستخدم عادة في الاقتصاد القياسي والتحليل المالي. على سبيل المثال، عند العمل مع بيانات أسعار الأسهم، يمتد الاهتمام إلى ما هو أبعد من نمذجة الأسعار المحتملة ليشمل التنبؤ بأوقات تغير الأسهم بشكل كبير.
تقوم أساليب الانحدار الذاتي بتوليد احتمالية ظهور تسلسلات من الرموز المميزة، لاقتراح حرف مثلاً أو كلمة تالية محتملة في النص التنبؤي. وتحسب نماذج لغة الانحدار الذاتي احتمالية كل رمز مميز محتمل بالنظر إلى الرموز المميزة السابقة له في نفس السلسلة. بالنظر إلى السلسلة "the mouse ate the" فإن النموذج الذي شهد عددًا معقولاً من الجمل الإنجليزية من المحتمل أن يعين احتمالية أعلى لكلمة "cheese" مقارنة بكلمة "homework". يتم تعيين هذا الاحتمال من خلال عملية الانحدار التلقائي التي تستخدم جميع الرموز المميزة السابقة في السلسلة لتعيين الاحتمالات لكل رمز مميز في نموذج اللغة.
يوجد تطبيق مختلف لمبادئ الانحدار الذاتي وهو استخدام مواقع القيم كتسلسل وحدوث انحدار لجميع المواقع ذات الصلة في الموقع محل الاهتمام. على سبيل المثال، قد نشك في أن المسافة من المصنع تؤثر على قراءات جودة الهواء. هنا يفيدنا نموذج الانحدار الذاتي حيث يستخدم القراءات من المواقع الأخرى كقيم متغيرات متباطئة ويستخدم المسافة من المصنع كقيم متغيرات متباطئة.
احصل على رؤى فريدة حول تطور مشهد الحلول في مجال التحليلات وذكاء الأعمال (ABI)، مع تسليط الضوء على النتائج الرئيسية، والافتراضات، والتوصيات لقادة البيانات والتحليلات.
تمكَّن من تبسيط الوصول إلى البيانات وأتمتة إدارة البيانات. اكتشف قوة دمج استراتيجية مستودع بحيرة البيانات في بنية بياناتك، بما في ذلك تحسين التكاليف لأعباء العمل وتوسيع نطاق الذكاء الاصطناعي والتحليلات لديك، باستخدام جميع بياناتك وفي أي مكان.
استكشف دليل قائد البيانات لإنشاء مؤسسة قائمة على البيانات وتعزيز ميزة الأعمال.
تعرَّف على كيفية مساهمة نهج مستودع بحيرة البيانات المفتوحة في تقديم بيانات موثوق بها وتنفيذ مشاريع التحليلات والذكاء الاصطناعي بشكل أسرع.
لكي تزدهر الشركات، يجب عليها استخدام البيانات لتعزيز ولاء العملاء، وأتمتة عمليات الأعمال، والابتكار باستخدام الحلول المستندة إلى الذكاء الاصطناعي.
استفِد من قيمة بيانات المؤسسة مع IBM Consulting لبناء مؤسسة تعتمد على الرؤى لتحقيق ميزة تنافسية في الأعمال.
تعرَّف على Cognos Analytics 12.0، رؤى مدعومة بالذكاء الاصطناعي لتحسين عملية اتخاذ القرارات.
IBM web domains
ibm.com, ibm.org, ibm-zcouncil.com, insights-on-business.com, jazz.net, mobilebusinessinsights.com, promontory.com, proveit.com, ptech.org, s81c.com, securityintelligence.com, skillsbuild.org, softlayer.com, storagecommunity.org, think-exchange.com, thoughtsoncloud.com, alphaevents.webcasts.com, ibm-cloud.github.io, ibmbigdatahub.com, bluemix.net, mybluemix.net, ibm.net, ibmcloud.com, galasa.dev, blueworkslive.com, swiss-quantum.ch, blueworkslive.com, cloudant.com, ibm.ie, ibm.fr, ibm.com.br, ibm.co, ibm.ca, community.watsonanalytics.com, datapower.com, skills.yourlearning.ibm.com, bluewolf.com, carbondesignsystem.com, openliberty.io