ما الارتباط الذاتي؟

24 مايو 2024

المؤلفين

Joshua Noble

Data Scientist

Eda Kavlakoglu

Program Manager

يوفر الارتباط الذاتي تحليل البيانات لبيانات المتواليات الزمنية والنمذجة، ويتم استخدامه على نطاق واسع في الاقتصاد القياسي ومعالجة الإشارات والتنبؤ بالطلب.

يحلل الارتباط الذاتي -أو الارتباط التسلسلي- بيانات المتواليات الزمنية للبحث عن الارتباطات في القيم عند نقاط مختلفة في متوالية زمنية، وتقيس هذه الطريقة الرئيسية في التحليل كيفية ارتباط القيمة بنفسها، فبدلاً من حساب معامل الارتباط بين المتغيرات المختلفة، مثل X1 وX2، نحسب درجة ارتباط المتغير نفسه في خطوات زمنية عبر مجموعة البيانات. عند بناء نموذج الانحدار الخطي، فإن أحد الافتراضات الأساسية هو أن الأخطاء في التنبؤ بالمتغير المستقل في هذا النموذج مستقلة. وفي كثير من الأحيان عند العمل باستخدام بيانات المتواليات الزمنية، ستجد أخطاء تعتمد على الوقت، أي أن التبعية في الأخطاء تظهر بسبب عنصر زمني. تسمى مصطلحات الخطأ المترابطة بمرور الوقت بالأخطاء المترابطة ذاتيًا، وتتسبب هذه الأخطاء في حدوث مشكلات في بعض الطرق الأكثر شيوعًا لإنشاء انحدار خطي مثل المربعات الصغرى الخطية. ويمكن معالجة تلك الأخطاء عن طريق جعل المتغير التابع يتراجع على نفسه باستخدام فترات التأخير التي يحددها اختبار الارتباط الذاتي، و"التأخر" هو ببساطة قيمة سابقة للمتغير التابع. إذا كانت لديك بيانات شهرية وتريد التنبؤ بالشهر القادم، فيمكنك استخدام قيم الشهرين السابقين كمدخلات، وهذا يعني أنك تعيد تراجع الفترتين السابقتين على القيمة الحالية.

بنفس الطريقة التي يقيس بها الارتباط العلاقة الخطية بين متغيرين، يقيس الارتباط الذاتي العلاقة بين القيم المتأخرة لمتوالية زمنية من خلال نموذج خطي، فعندما يكون للبيانات اتجاه، تميل الارتباطات الذاتية للتأخيرات الصغيرة إلى أن تكون كبيرة وإيجابية لأن الملاحظات القريبة في الوقت تكون قريبة أيضًا من حيث القيمة، ولذا فإن دالة الارتباط الذاتي -التي تسمى غالبًا ACF- لمتوالية زمنية متجهة تميل إلى التحلي بقيم إيجابية تنخفض ببطء مع زيادة التأخيرات.

عندما يكون للبيانات تقلبات أو أنماط موسمية، ستكون الارتباطات الذاتية أكبر بالنسبة للتأخيرات الموسمية (عند مضاعفات الفترة الموسمية) مقارنة بالتأخيرات الأخرى، وعندما تكون البيانات متداولة وموسمية على حد سواء، فإنك ترى مزيجًا من هذه التأثيرات، فالمتواليات الزمنية التي لا تظهر أي ارتباط ذاتي هي عمليات عشوائية حقًا وتسمى بالضوضاء البيضاء. دالة الارتباط الذاتي (ACF) هي معامل الارتباط بين قيمتين في متوالية زمنية.

هناك عدة طرق رئيسية لاختبار الارتباط التلقائي:

يمكنك حساب البقايا ورسم تلك الأخطاء القياسية في الوقت t، وعادة ما تكتب et، مقابل t، وقد تشير أي مجموعات من البقايا الموجودة على جانب واحد من خط الصفر إلى موضع وجود الارتباطات الذاتية وموضع أهميتها.

يمكن أن يساعد إجراء اختبار Durbin-Watson في تحديد ما إذا كانت المتوالية الزمنية تحتوي على ارتباط تلقائي، وللقيام بذلك في R، أنشئ انحدارًا خطيًا ينحدر بالمتغير التابع على الزمن ثم مرر هذا النموذج لحساب إحصائية Durbin-Watson. وللقيام بذلك باستخدام Python، يمكنك تمرير البقايا من نموذج الانحدار الخطي المناسب إلى الاختبار.

الخيار الآخر هو أن تستخدم اختبار Ljung Box وتمرِّر قيم المتوالية الزمنية مباشرةً إلى الاختبار، ويحتوي اختبار Ljung-Box على فرضية فارغة مفادها أن البقايا موزعة بشكل مستقل، ويحتوي على فرضية بديلة مفادها أن البقايا لا تُوزَّع بشكل مستقل وتظهر ارتباطًا ذاتيًا، وهذا يعني عمليًا أن النتائج الأصغر من 0.05 تشير إلى وجود ارتباط ذاتي في المتوالية الزمنية. توفر كل من مكتبات Python وR طرقًا لتشغيل هذا الاختبار.

يتمثل الخيار الأكثر شيوعًا في استخدام تصور لمصفوفة الارتباط، والذي يتم إنشاؤه من الارتباطات بين فترات تأخر محددة في المتواليات الزمنية. يعد وجود نمط في النتائج مؤشرًا على الارتباط التلقائي، ويُرسم ذلك من خلال إظهار مدى ارتباط التأخيرات المختلفة عبر المتوالية الزمنية، وفيما يلي مثال على المخطط:

تحتوي البيانات غير العشوائية على تأخر كبير واحد على الأقل. عندما لا تكون البيانات عشوائية، فهذا مؤشر جيد على أنك بحاجة إلى استخدام تحليل المتواليات الزمنية أو دمج التأخيرات في تحليل الانحدار لتقوم بنمذجة البيانات بشكل مناسب.

هناك ميزات أساسية للمتوالية الزمنية يمكن تحديدها من خلال الارتباط الذاتي.

  • الثبات
  • الاتجاهات الرائجة
  • الموسمية

الثبات

تحتوي السلسلة الزمنية الثابتة على خصائص إحصائية ثابتة بمرور الوقت، وهذا يعني أن الإحصائيات مثل المتوسط والتباين والارتباط الذاتي لا تتغير عبر البيانات. تعتمد معظم طرق التنبؤ الإحصائي -بما في ذلك ARMA وARIMA- على افتراض أنه يمكن جعل المتوالية الزمنية ثابتة تقريبًا من خلال تحول واحد أو أكثر، ومن السهل نسبيًا التنبؤ بالسلسلة الثابتة؛ لأنه يمكنك ببساطة التنبؤ بأن الخصائص الإحصائية ستكون هي نفسها تقريبًا في المستقبل كما كانت في الماضي، ويعني الثبات أن المتوالية الزمنية ليس لها اتجاه، وأن لها تباين ثابت ونمط ارتباط ذاتي ثابت وأنه ليس لها نمط موسمي. تنخفض دالة الارتباط الذاتي (ACF) إلى ما يقرب من الصفر بسرعة للمتوالية الزمنية الثابتة، وفي المقابل، تنخفض دالة الارتباط الذاتي (ACF) ببطء للمتوالية الزمنية غير الثابتة.

الاتجاه

من السمات الرئيسية لبيانات المتواليات الزمنية هي ما إذا كان الاتجاه ظاهرًا في البيانات أم لا، على سبيل المثال، ستُظهر أسعار السلع الأساسية في أحد متاجر البقالة خلال الخمسين عامًا الماضية اتجاهًا؛ لأن التضخم سيؤدي إلى ارتفاع هذه الأسعار. قد يكون التنبؤ بالبيانات التي تحتوي على اتجاهات أمرًا صعبًا لأن الاتجاه يحجب الأنماط الأخرى في البيانات. إذا كانت البيانات تحتوي على خط توجه ثابت تعود إليه باستمرار فقد تكون ثابتة الاتجاه، وفي هذه الحالة يمكن إزالة الاتجاه بمجرد تركيب خط اتجاه وطرح الاتجاه من البيانات قبل تركيب نموذج له، أما إذا لم تكن البيانات ثابتة الاتجاه، فقد تكون ثابتة في الفرق، وفي هذه الحالة يمكن إزالة الاتجاه عن طريق التمييز. إن أبسط طريقة للتمييز هي طرح القيمة السابقة من كل قيمة للحصول على مقياس لمقدار التغيير الموجود في بيانات المتواليات الزمنية، فعلى سبيل المثال، إذا كانت Yt هي قيمة المتوالية الزمنية Y في الفترة t، فإن الفرق الأول لـ Y في الفترة t يساوي YYt-1. عندما تكون الاتجاهات موجودة في متوالية زمنية، عادة ما يكون للتأخيرات الأقصر ارتباط إيجابي قوي أو قيم ارتباط سلبية قوية في دالة الارتباط الذاتي (ACF) لأن الملاحظات الأقرب في الوقت تميل إلى التمتع بقيم مماثلة. ستتناقص الارتباطات في دالة الارتباط الذاتي (ACF) ببطء مع زيادة فترات التأخير.

الموسمية

تتمثل الموسمية عندما تحتوي المتوالية الزمنية على تقلبات أو تغيرات موسمية. من المحتمل أن نتوقع أن ترتفع مبيعات الآيس كريم (المثلجات) في أشهر الصيف وتنخفض في أشهر الشتاء، وقد ترتفع مبيعات التزلج بشكل موثوق في أواخر الخريف وتنخفض في أوائل الصيف، ويمكن أن تتمثل الموسمية في فترات زمنية مختلفة مثل الأيام أو الأسابيع أو الأشهر، فإن مفتاح تحليل المتواليات الزمنية هو فهم كيفية تأثير الموسمية على سلسلتنا، ما يجعلنا ننتج توقعات أفضل للمستقبل. عند وجود أنماط موسمية، ستظهر قيم دالة الارتباط الذاتي (ACF) ارتباطًا ذاتيًا إيجابيًا للتأخيرات عند مضاعفات التردد الموسمي مقارنة بالتأخيرات الأخرى.

الارتباط الذاتي الجزئي

تشبه دالة الارتباط الذاتي الجزئي -التي تسمى غالبًا PACF- دالة الارتباط الذاتي (ACF) باستثناء أنها تعرض فقط الارتباط بين ملاحظتين لا تفسرهما فترات التأخير الأقصر بينهما. يُظهر مخطط دالة الارتباط الذاتي (ACF) العلاقة بين yt وyt−k لقيم مختلفة لـ وإذا كان yt وy t−1 مرتبطين ببعضهما البعض، فقد نفترض أن yt−1 وy t−2 سيكونان مرتبطين أيضًا لأن كلاهما مرتبطان بتأخير قدره 1. ومع ذلك، من الممكن أيضًا ربط yt وy t−2 ببساطة لأن كلاهما مرتبط بـ yt−1، وليس بسبب وجود معلومات جديدة واردة في yt−2، والتي يمكن استخدامها في التنبؤ بـ yt. وللتغلب على هذه المشكلة، نستخدم الارتباطات الذاتية الجزئية لإزالة عدد من ملاحظات التأخير. تقيس دالة الارتباط الذاتي الجزئي (PACF) فقط العلاقة بين yt وyt− k  عن طريق إزالة تأثيرات التأخيرات من 1 إلى ودائمًا ما يكون الارتباط الذاتي الجزئي الأول مطابقًا للارتباط الذاتي الأول نظرًا لعدم وجود بيانات جديدة بينهما لإزالتها، وستظهر جميع التأخيرات اللاحقة فقط العلاقة بين التأخيرات بعد إزالة جميع التأخيرات المتداخلة، ويمكن أن يوفر هذا في كثير من الأحيان تقديرًا أكثر دقة عن أي الفترات الزمنية المتأخرة قد تحتوي على مؤشرات للموسمية من خلال ملاحظة الأماكن التي توجد فيها قيم أكبر من الارتباط الذاتي الإيجابي أو السلبي.

من الناحية العملية، تساعد دالة الارتباط الذاتي (ACF) على تقييم خصائص المتوالية الزمنية، ومن ناحية أخرى، تكون دالة الارتباط الذاتي الجزئي (PACF) أكثر فائدة أثناء عملية المواصفات لنموذج الانحدار الذاتي، وسيستخدم علماء البيانات أو المحللون مخططات الارتباط الذاتي الجزئي لتحديد نماذج الانحدار مع بيانات المتواليات الزمنية أو نماذج المتوسط المتحرك الانحداري الذاتي (ARMA) أو نماذج المتوسط المتحرك الانحداري الذاتي المتكامل (ARIMA).

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

Mixture of Experts | بودكاست

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضم إلى لجنة عالمية المستوى من المهندسين والباحثين وقادة المنتجات وغيرهم وهم يجتازون طريق الذكاء الاصطناعي لتزويدك بأحدث أخباره والمعارف المتعلقة به.

حلول ذات صلة
أدوات التحليلات والحلول ذات الصلة بها

لكي تزدهر الشركات، يجب عليها استخدام البيانات لتعزيز ولاء العملاء، وأتمتة عمليات الأعمال، والابتكار باستخدام الحلول المستندة إلى الذكاء الاصطناعي.

استكشف حلول التحليلات
خدمات الاستشارات في مجال البيانات والتحليلات

استفِد من قيمة بيانات المؤسسة مع IBM Consulting لبناء مؤسسة تعتمد على الرؤى لتحقيق ميزة تنافسية في الأعمال.

اكتشف خدمات التحليلات
IBM Cognos Analytics

تعرَّف على Cognos Analytics 12.0، رؤى مدعومة بالذكاء الاصطناعي لتحسين عملية اتخاذ القرارات.

استكشف Cognos Analytics
اتخِذ الخطوة التالية

لكي تزدهر الشركات، يجب عليها استخدام البيانات لتعزيز ولاء العملاء، وأتمتة عمليات الأعمال، والابتكار باستخدام الحلول المستندة إلى الذكاء الاصطناعي.

استكشف حلول التحليلات اكتشف خدمات التحليلات