ما هو نموذج السلاسل الزمنية؟

المؤلفون

Ivan Belcic

Staff writer

Cole Stryker

Staff Editor, AI Models

IBM Think

ما هو نموذج السلاسل الزمنية؟

نموذج السلاسل الزمنية هو نموذج تعلّم آلي يمكنه تحليل بيانات السلاسل الزمنية المتسلسلة والتنبؤ بالقيم المستقبلية. تتكون مجموعات بيانات السلاسل الزمنية من قيم بيانات مرتبة بمرور الوقت، مع الوقت كمتغير مستقل. يسمح تحليل السلسلة الزمنية بالتنبؤ بقيم البيانات المستقبلية استنادًا إلى القيم السابقة في التسلسل. 

ما هي نمذجة السلاسل الزمنية؟

نمذجة السلاسل الزمنية هي استخدام خوارزميات التعلم الآلي والأساليب الإحصائية لتحليل نقاط البيانات التي تتغير على مدار فترة زمنية. 

تختلف مجموعات البيانات المتسلسلة الزمنية عن مجموعات البيانات الأخرى في أنها لا تتكون من نقاط بيانات مستقلة وغير ذات صلة. في حين أن العديد من مجموعات البيانات تستند إلى ملاحظات فردية، فإن مجموعات بيانات السلاسل الزمنية يتم تمييزها بطوابع زمنية وتتبع المتغيرات عبر الزمن، مما يخلق تبعيات بين نقاط البيانات. والتبعيات هي علاقات بين نقاط البيانات التي تؤثر فيها قيمة إحداها على قيمة أخرى. 

في نمذجة السلاسل الزمنية أحادية المتغير، يكون الزمن هو المتغير المستقل الوحيد. وتعتمد جميع المتغيرات الأخرى على القيم السابقة. حيث تقدم نمذجة السلاسل الزمنية متعددة المتغيرات المزيد من المتغيرات المستقلة، مثل الأحوال الجوية أو المعلومات الديموغرافية.

أحدث الأخبار التقنية، مدعومة برؤى خبراء

ابقَ على اطلاع دومًا بأهم—اتجاهات المجال وأكثرها إثارة للفضول—بشأن الذكاء الاصطناعي والأتمتة والبيانات وغيرها الكثير مع نشرة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! أنت مشترك.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

المفاهيم الأساسية لنمذجة السلاسل الزمنية

تُعدُّ العديد من المفاهيم الأساسية في نمذجة السلاسل الزمنية ميزات زمنية: حيث ترتبط جوانب البيانات بالوقت أو تكون مشتقة منه. تشمل هذه المفاهيم ما يلي: 

  • الارتباط الذاتي

  • الموسمية

  • الثبات

الارتباط الذاتي

الارتباط التلقائي الذي يقيس الدرجة التي تتوافق بها القيم الحالية مع القيم السابقة للبيانات التاريخية السابقة في سلسلة زمنية. يعني الارتباط التلقائي العالي أن التكرار الحالي لسلسلة زمنية يتم تعيينه بشكل وثيق مع الإصدارات المتأخرة. ويحدد الارتباط التلقائي ما إذا كانت السلسلة الزمنية تتكرر ويمكن أن تشير إلى الموسمية. 

يمكن أن يكون الارتباط الذاتي إيجابيًا أو سلبيًا. يعني الارتباط الذاتي الإيجابي أن القيم العالية تؤدي إلى قيم أعلى والقيم المنخفضة تؤدي إلى قيم أقل. أما الارتباط الذاتي السلبي فهو عكس ذلك: حيث القيم العالية تتبع القيم المنخفضة والعكس صحيح.

الموسمية

الموسمية هي سمة من سمات بيانات السلاسل الزمنية التي يوجد فيها نمط متكرر يعتمد على فاصل زمني منتظم، مثل تغير فصول السنة. على سبيل المثال، تبيع منصة التجارة الإلكترونية المزيد من النظارات الشمسية في فصلي الربيع والصيف والمزيد من الأوشحة في الخريف والشتاء. وتستهلك البيوت عادةً كميات أكبر من الكهرباء أثناء النهار مقارنة بالليل. 

تُعد الاختلافات الموسمية المعتمدة على الوقت مفيدة عند التنبؤ بالقيم المستقبلية باستخدام نماذج التنبؤ. بينما أدوات عرض مصور للبيانات كالمخططات والرسوم البيانية فتصور الموسمية على أنها تذبذب متكرر، غالبًا في شكل موجة جيبية. 

أثناء تحليل بيانات السلاسل الزمنية، تكشف عملية التحلل عن أي موسمية موجودة في البيانات، بالإضافة إلى الاتجاهات والتشويش. فالاتجاهات العامة تعني حدوث زيادات أو نقصان طويل الأجل في قيم البيانات، بينما يشير التشويش إلى الاختلافات العشوائية التي لا تتبع الأنماط التي يمكن التنبؤ بها. بينما التشويش غالبًا ما ينشأ من الأخطاء والقيمة الخارجية.

الثبات

تحتوي السلسلة الزمنية الثابتة على خصائص إحصائية ثابتة، مثل المتوسط والتباين. ومع الثبات، تتقلب نقاط البيانات مع الموسمية، لكن لا تظهر نزعة عامة أكبر. قد تكون السلسلة الزمنية لمتوسط درجات الحرارة العالمية السنوية الحديثة غير ثابتة بسبب تأثيرات التغير المناخي التي تؤدي إلى ارتفاع درجات الحرارة. 

الثبات ضروري لمعظم نماذج السلاسل الزمنية لتعمل بفعالية. يكشف اختبار Dickey-Fuller ما إذا كانت مجموعة البيانات ثابتة أم لا. حيث يمكن تحويل مجموعات بيانات السلاسل الزمنية التي لا تتسم بالثبات باستخدام طرق مثل التباين لإزالة الاتجاهات وعزل الأنماط الأخرى، مثل الموسمية والارتباط التلقائي.

Mixture of Experts | 28 أغسطس، الحلقة 70

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

نماذج السلاسل الزمنية

عند الاقتراب من تحدي التنبؤ بالسلاسل الزمنية، يمكن لعلماء البيانات الاختيار من بين خوارزميات التعلم الآلي المختلفة. وحسب طبيعة مجموعة البيانات، يكون بعضها أكثر ملاءمة من غيرها. وتتنبأ النماذج المكونة من خطوة واحدة بالنقطة التالية في سلسلة زمنية، بينما تنتج النماذج متعددة الخطوات تنبؤات متعددة للسلاسل الزمنية. 

تشمل أنواع طرازات السلاسل الزمنية ما يلي: 

  • المتوسط المتحرك المتكامل الانحدار الذاتي (نموذج آريما "ARIMA") 

  • التجانس الأسّي

  • التناقل الذاتي غير المتجانس الشرطي المعمم (GARCH) 

  • الذاكرة الطويلة قصيرة المدى (LSTM) 

يُعد كل من نموذج Prophet مفتوح المصدر من شركة Meta، ونموذج DeepAR من شركة Amazon، نموذجين آخرين للذكاء الاصطناعي تم بناؤهما لنمذجة السلاسل الزمنية. من الممكن أيضًا تكييف نماذج الانحدار لمهام التنبؤ بالسلاسل الزمنية. كما يمكن تطبيق نماذج التعلم الأخرى الخاضعة للإشراف مثل XGBoost والغابة العشوائية لبيانات السلاسل الزمنية غير الخطية.

المتوسط المتحرك الانحداري التلقائي المتكامل (ARIMA)

تتكون عائلة نماذج ARIMA من العديد من نماذج اللبنات الأساسية المعيارية التي يمكن تشغيلها بمفردها أو دمجها في مجموعات مختلفة. فنموذج ARIMA هو نموذج إحصائي يتنبأ بالقيم المستقبلية بناءً على الأحداث الماضية ويعمل بشكل أفضل مع السلاسل الزمنية الثابتة التي تظهر الموسمية. ويتفوق مع مجموعات البيانات أحادية المتغير ويمكن تكييفه مع حالات الاستخدام متعددة المتغيرات أيضًا. 

تتضمن تكوينات نموذج ARIMA ما يلي: 

  • الانحدار الذاتي (AR): تتنبأ نماذج الانحدار الذاتي، التي يُرمز لها بـ AR (p)، بالقيم المستقبلية لمتغير ما بناءً على القيم السابقة ضمن حدٍّ عشوائي؛ وهو حد غير قابل للتنبؤ به بشكل كامل. يشير البارامتر p إلى درجة التأخر أو عدد نقاط البيانات المستخدمة للتنبؤ. ستصل قيمة p 1 إلى الملاحظة السابقة في السلسلة. 

  • المتوسط المتحرك (MA): تتنبأ نماذج المتوسط المتحرك، المشار إليها ب MA (q)، بالقيم المستقبلية بناءً على أخطاء التنبؤ السابقة. البارامتر q هو عدد الأخطاء المضمنة في التنبؤ. نموذج MA(1) سوف يتضمن خطأ واحدًا في الماضي. 

  • التكامل (I): تضيف النماذج المتكاملة التباين (د) لجعل السلسلة الزمنية ثابتة. يستبدل التباين قيم البيانات بالفرق بين القيم الحالية والقيم السابقة، مما يؤدي إلى إنشاء سلسلة جديدة لتمثيل التغيير في القيم. يشير البارامتر d إلى عدد مرات اختلاف نقاط البيانات. 

  • المتوسط المتحرك الانحداري التلقائي الانحداري (ARMA): تجمع نماذج ARMA بين الانحدار التلقائي والمتوسطات المتحركة. يمكن لنماذج ARMA معالجة السلاسل الزمنية الثابتة ويُشار إليها ب ARMA (p، q). 

  • المتوسط المتحرك المتكامل ذاتيّ الانحدار (ARIMA): تضيف نماذج ARIMA، المشار إليها باسم ARIMA (p، d، q) اختلافًا إلى سلاسل زمنية نموذجية غير ثابتة. 

  • المتوسط المتحرك الموسمي الانحداري التلقائي المتكامل الموسمي (SARIMA): تضيف نماذج SARIMA الموسمية. يتم تمثيل معاملات الموسمية بأحرف كبيرة ويشير البارامتر m إلى مدة الموسم. يُشار إلى نماذج SARIMA بالرمز SARIMA(p, d, q)(P, D, Q)m وتتطلب كمية كبيرة من البيانات التاريخية السابقة. 

  • SARIMA مع المتغيرات الخارجية (SARIMAX): تتضمن بيانات السلسلة الزمنية الأكثر تعقيدًا متغيرات بالإضافة إلى الوقت. تتضمن نماذج SARIMAX متغيرات خارجية لتوليد تنبؤات أكثر دقة. 

  • الانحدار الذاتي المتجه (VAR): في حين أن نموذج آريما (ARIMA) يعمل بشكل أفضل مع المهام أحادية المتغير، نجد أن الانحدار الذاتي المتجه (VAR) يمكنه التعامل مع مجموعات البيانات متعددة المتغيرات. حيث يمكن لنماذج VAR، بما في ذلك VARMA وVARMAX، إجراء تنبؤات لنماذج سلاسل زمنية متعددة في نفس الوقت.

التمهيد الأسّي

تقلل نماذج التمهيد الأسي من التشويش عن طريق تعيين وزن أو أهمية أقل تدريجيًّا للملاحظات القديمة في السلاسل الزمنية. تُعدُّ الملاحظات الأحدث أكثر أهمية في إعداد التنبؤات المستقبلية. تشمل نماذج التمهيد الأسي ما يلي: 

  • التمهيد الأسي البسيط (SES): الشكل الأساسي للتمهيد الأسي البسيط هو تعديل المتوسط المتحرك لإعطاء وزن أكبر للملاحظات الحديثة. مقارنةً بنموذج المتوسط المتحرك المباشر (أو البسيط)، فإن التمهيد الأُسّي البسيط يقلل التشويش مع الحفاظ على مزيد من التفاصيل. 

  • التمهيد الأسي المزدوج (DES): يساعد التطبيق المتكرر للتمهيد الأسي مرتين على مواجهة الاتجاهات. يستخدم DES المعلمات α كعامل تمهيد البيانات وβ كعامل تمهيد الاتجاه. 

  • التمهيد الأُسّي الثلاثي (TES): بالنسبة لمجموعات البيانات التي لها اتجاهات ولها موسمية على حد سواء، نجد أن التمهيد الأُسّي الثلاثي ـ والمعروف أيضًا باسم تمهيد Holt-Winters الأسي - يطبق التمهيد للمرة الثالثة. المعلمة γ هي عامل التمهيد الموسمي. 

  • TBATS: (اختصار لكل من الدوال المثلثية، وBox-Cox وARMA، والنزعة العامة، والمكونات الموسمية) هو نموذج تمهيد أُسّي متخصص للسلاسل الزمنية التي تحتوي على موسمية معقدة.

التباين غير المتجانس المشروط الانحداري التلقائي المعمم (GARCH)

يُعدُّ نموذج GARCH نموذجًا متخصصًا يتتبع التقلبات في القطاع المالي. ففي سوق الأسهم مثلًا نجد أن التقلب يشير إلى مقدار تقلب أسعار الأسهم وسرعة حدوثه. التغاير في التباين يعني أن الأخطاء في نموذج الانحدار لا تتشارك التباين نفسه بمرور الوقت. 

في علم البيانات، تُعدُّ المتغيرات متماثلة إذا كانت الاختلافات بينها هي نفسها وغير متجانسة إذا لم تكن كذلك.

الذاكرة الطويلة قصيرة المدى (LSTM)

يوفر نموذج LSTM (الذاكرة قصيرة المدى طويلة الأجل) قوة شبكات التعلم العميق العصبية لنمذجة السلاسل الزمنية. نموذج LSTM عبارة عن شبكة عصبية متكررة (RNN) متخصصة في البيانات المتسلسلة، مثل السلاسل الزمنية. تتفوق نماذج LSTM في التقاط التبعيات بعيدة المدى: العلاقات بين نقاط البيانات البعيدة في تسلسل. 

نظرًا لقدرتها على الاحتفاظ بسياق أكبر من الأنواع الأخرى من النماذج، تعمل نماذج LSTM بشكل جيد في التطبيقات المعقدة، مثل معالجة اللغة الطبيعية (NLP) والتعرف على الكلام والصور في العالم الحقيقي. فهي تتطلب كميات كبيرة من بيانات التدريب ويمكن بناؤها في Python.

مقاييس نمذجة السلاسل الزمنية

تساعد مقاييس المعايير المرجعية والاختبار والتحقق من الصحة على تحسين أداء النموذج، كما هو الحال في العديد من تطبيقات التعلم الآلي الأخرى. 

تتضمن مقاييس نمذجة السلسلة الزمنية ما يلي: 

  • متوسط الخطأ التربيعي (MSE): متوسط مربعات الخطأ عند كل طابع زمني. 

  • جذر متوسط الخطأ التربيعي الجذري (RMSE): الجذر التربيعي لمتوسط الخطأ التربيعي المتعدد. 

  • متوسط الخطأ المطلق (MAE): متوسط قيم الخطأ لكل ملاحظة. 

  • متوسط النسبة المئوية للخطأ المطلق (MAPE): يعبر عن متوسط الخطأ المئوي المطلق في صورة نسبة مئوية، مما يوضح حجم الخطأ. يعرف متوسط MAPE أيضًا باسم متوسط النسبة المطلقة للانحراف (MAPD). يُعدُّ متوسط MAPE دالة خسارة شائعة في مشكلات الانحدار.

حالات استخدام نمذجة السلاسل الزمنية

تمثل نماذج السلاسل الزمنية دورًا قويًا في التحليلات، حيث تساعد علماء البيانات وقادة الأعمال على حد سواء فيما يلي: 

  • التعرف على الأنماط: تحدد نماذج السلاسل الزمنية التقلبات المتكررة في البيانات على مر الزمن، مثل التغيرات الموسمية والدورات طويلة الأجل والاتجاهات العامة. على سبيل المثال، في مجال الموضة، ترتفع مبيعات التيشِرتات بشكل موسمي كل ربيع وصيف. تتكرر موضة الأزياء وتتلاشى في دورات متعددة العقود؛ فالملابس ذات القصات الواسعة رائجة الآن كما كانت في حقبة التسعينيات. 

  • اكتشاف الشذوذ: الشذوذات هي نقاط بيانات تنحرف عن بقية نقاط البيانات في مجموعة البيانات. في حين أن الحالات الشاذة العرضية يمكن أن تعزى إلى البيانات المشوِّشة، فإن كميات أكبر من البيانات الشاذة يمكن أن تشير إلى تحولات غير متوقعة ومشكلات في مسار البيانات وفرص التحسين. 

  • التنبؤ: استنادًا إلى البيانات التاريخية، يمكن لنماذج السلاسل الزمنية التنبؤ بنقاط البيانات المستقبلية في السلسلة. يمكن لمجموعة استخدام هذه التوقعات لاتخاذ قرارات قائمة على البيانات.

حلول ذات صلة
أدوات التحليلات والحلول ذات الصلة بها

لكي تزدهر الشركات، يجب عليها استخدام البيانات لتعزيز ولاء العملاء، وأتمتة عمليات الأعمال، والابتكار باستخدام الحلول المستندة إلى الذكاء الاصطناعي.

استكشف حلول التحليلات
خدمات الاستشارات في مجال البيانات والتحليلات

استفِد من قيمة بيانات المؤسسة مع IBM Consulting لبناء مؤسسة تعتمد على الرؤى لتحقيق ميزة تنافسية في الأعمال.

اكتشف خدمات التحليلات
IBM Cognos Analytics

تعرَّف على Cognos Analytics 12.0، رؤى مدعومة بالذكاء الاصطناعي لتحسين عملية اتخاذ القرارات.

استكشف Cognos Analytics
اتخِذ الخطوة التالية

لكي تزدهر الشركات، يجب عليها استخدام البيانات لتعزيز ولاء العملاء، وأتمتة عمليات الأعمال، والابتكار باستخدام الحلول المستندة إلى الذكاء الاصطناعي.

استكشف حلول التحليلات اكتشف خدمات التحليلات