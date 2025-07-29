في الشهر الماضي، أثارت لعبة تعمل على جهاز Atari 2600 ثماني البِت ومن دون ذاكرة وصول عشوائي، يعود تاريخها إلى عام 1979، ضجّة في أوساط الذكاء الاصطناعي وعالم الألعاب، بعد أن نجحت في هزيمة ChatGPT وMicrosoft Copilot في الشطرنج. رأى كثير من المشكّكين في الذكاء الاصطناعي في هذه الواقعة تجسيدًا لقصة "داود في مواجهة جالوت"، ودليلًا على أنّ الذكاء الاصطناعي التوليدي لا يعدو أن يكون كلامًا كثيرًا من دون ذكاء حقيقي. وحملت عناوين عديدة تغطّي التجربة – التي نفّذها مهندس Citrix Robert Caruso وشرحها في عدة منشورات على LinkedIn – صياغات مثل: "ذكاء اصطناعي يتلقّى درسًا على يد لعبة Atari عمرها 50 عامًا" (AI schooled by 50-year-old Atari).
وبحسب خبراء IBM، فإن هذه الضجة تذكير مهم بما يمكن وما لا يمكن للذكاء الاصطناعي التوليدي إنجازه، وبالطريقة التي تعمل بها هذه النماذج في الأساس. يقول Chris Hay، المندس المتميّز في IBM، في حديث إلى IBM Think: "الناس يحاولون استخدام ChatGPT في عدد كبير جدًّا من المهام. التفكير في أنّ ChatGPT يمكنه لعب الشطرنج يشبه افتراض أنّه يمكن أن يكون شريكًا عاطفيًا لك أو معالجًا نفسيًا."
ويرى Hay أن الهزيمة الواضحة التي مُنيت بها النماذج اللغوية الكبيرة (LLMs) تذكير جيّد بطبيعة عمل هذه النماذج؛ فهي تولّد المخرجات استنادًا إلى الارتباطات التي تعلّمتها بين الكلمات، لا استنادًا إلى منطق قائم على القواعد أو قدرات تخطيط حقيقية. ولهذا السبب نفسه لا تؤدي النماذج اللغوية الكبيرة أداءً جيّدًا في الشطرنج، وأحيانًا تخطئ حتى في مسائل الجمع أو لعبة "إكس-أو" (tic-tac-toe): فهي ببساطة ليست مصمَّمة لهذه النوعية من المهام.
ويقول Hay: "في نهاية المطاف، الشطرنج مشكلة بحث (search problem)." فمع كل نقلة، يحتاج اللاعب – سواء كان إنسانًا أو آلة – إلى المسح داخل شجرة قرارات، وتقييم النتائج المحتملة، وترتيب الخيارات وفقًا لقيمتها المتوقعة. لعبة Atari Video Chess مبرمجة خصيصًا للتعامل مع هذا النوع من مشكلات البحث. أما منطق عمل النماذج اللغوية الكبيرة، فيقوم – كما يوضح Hay – على "أنظمة التنبؤ بالرمز المميز التالي (next token prediction systems). هذه النماذج يُقدَّم لها عمليًا محتوى جزء كبير من الإنترنت، ثم تُدرَّب على التنبؤ بالكلمة التالية."
لكن لعبة الشطرنج لا تعمل وفق مبدأ التنبؤ بالرمز المميز التالي؛ إذ يقول Hay: "هناك عدد هائل من التركيبات الممكنة في اللعبة."
وفي مقابلة أخرى مع IBM Think، يوضح PJ Hagerty، Lead of AI Advocacy في IBM ولاعب الشطرنج التنافسي ومالك جهاز Atari 2600 الأصلي، أن لعبة الشطرنج على Atari تستخدم "أسلوب التجربة والخطأ (Brute-force)".
هذا الأسلوب، الذي اعتمدت عليه كثير من ألعاب الفيديو الاستراتيجية المبكرة، يقوم على استكشاف عدد كبير من النقلات المحتملة، ثم استخدام حسابات قائمة على الاحتمالات لاختيار النقلة المثلى في كل موقف. يقول Hagerty: "كانت تلك التعليمات البرمجية ترتكز على شجرة منطقية تستخدم المتوسطات لتحديد أفضل نقلة ممكنة."
وهكذا تعمل أشجار القرار في الشطرنج، أو ما يُعرَف أيضًا بأشجار اللعبة، سواء كان اللاعب إنسانًا أم آلة.
لنفترض أن لاعبين اثنين يتواجهان في مباراة شطرنج. يمتلك الأبيض حقّ النقلة الأولى، ويقرر اللاعب مثلًا تحريك بيدق الملك خانتين إلى الأمام. في تدوين الشطرنج يُشار إلى هذه النقلة عادة بالخانة E2 كنقطة انطلاق، وهي من أشهر النقلات الافتتاحية. بعد ذلك ينتقل الدور إلى الأسود. استنادًا إلى نقلة الأبيض من E2، يكون أمام الأسود 20 نقلة قانونية ممكنة: 16 نقلة لخواص البيادق، و4 نقلات لقطع الحصان. كل خيار من هذه الخيارات يفتح بدوره مجموعة جديدة من الإمكانات، ومع كل مستوى جديد من التفرّع يزداد حجم الشجرة زيادةً أُسِّية.
على سبيل المثال، في المباراة التاريخية التي أُقيمت عام 1956 بين اللاعبين الأمريكيين Bobby Fischer وDonald Byrne، استمرت المواجهة 41 نقلة كاملة، أي ما يعادل 82 "نصف نقلة" (plies). ويُقدَّر متوسط عدد النقلات القانونية الممكنة في كل وضعية لعب في الشطرنج – باختلاف التقديرات – بين 20 و40 نقلة؛ ولأغراض التبسيط، لنفترض أن المتوسط 30 نقلة. في هذه الحالة، يكون الحجم التقريبي لشجرة اللعبة مساويًا 3082، وهو عدد مكوَّن من 122 رقمًا، لذلك لا حاجة لكتابته كاملًا.
بالنسبة إلى اللاعب البشري العادي، من شبه المستحيل استيعاب مزايا وعيوب هذا العدد الهائل من النقلات المحتملة في ذهنه في اللحظة نفسها. وهذا في الواقع ليس ما يفعله اللاعبون. بدلًا من ذلك، يعتمدون على حدس وخبرة تراكمية لاستبعاد النقلات السيئة بوضوح، استنادًا إلى مبادئ أساسية مثل "لا تُعرِّض الوزيرة مبكرًا" في مجريات اللعب.
وفي لغة الشبكات العصبية، تُعرَف عملية تضييق نطاق الاحتمالات هذه باسم "التقليم" (pruning)، لأنها تعني عمليًا قطع عدد كبير من الفروع من شجرة اللعبة والاكتفاء بالفروع الواعدة. اللاعبون البشريون يقومون بعملية التقليم هذه بشكل طبيعي، وكذلك تفعل آلات الشطرنج الحاسوبية الحديثة المتقدمة. لكن لعبة شطرنج تعمل على جهاز ألعاب عمره أكثر من 40 عامًا لا تملك أي قدرات "تقليم" ذكية؛ لذلك تلجأ إلى استكشاف كل الاحتمالات المتاحة تقريبًا للنقلة أو النقلتين التاليتين، ثم تختار النقلة التي تمنحها أعلى احتمال إحصائي للفوز. أما أدوات الذكاء الاصطناعي التوليدي فلا تستخدم لا أسلوب "التجربة والخطأ" ولا تقنيات التقليم بهذا المعنى.
ومع ذلك، لا يعني هذا أن النماذج اللغوية الكبيرة (LLMs) عاجزة دائمًا عن لعب الشطرنج بمستوى جيد؛ فالأمر، كما يوضح Hay، يتعلّق إلى حد كبير بتزويدها بالأدوات المناسبة، مثل موجِّه منظَّم على مستوى النظام (structured system prompt) وآلية تتيح لها التخطيط لعدة خطوات مسبقًا. ويقول Hay: "لو قلتَ لنموذج ChatGPT مثلًا: (I give you permission to generate code)، ووفّرت له في الوقت نفسه مساحة أشبه بمفكرة للتخطيط يمكنه من خلالها متابعة مجريات المباراة، لراهنت على أنه سيكون قادرًا في الأغلب على تحقيق الفوز." في الوقت الراهن، لا تمتلك النماذج اللغوية الكبيرة قدرات "ذاتية" تمكّنها من تقرير أن هدفها هو الفوز في الشطرنج، أو اختيار الأدوات الأنسب لتحقيق هذا الهدف. لكن هذا الوضع لن يستمر على هذه الحال إلى الأبد. فمجال استدعاء الأدوات (tool calling) – أي تمكين نماذج الذكاء الاصطناعي من التفاعل مع أدوات خارجية – يُعد اليوم من مجالات البحث النشطة في عالم الذكاء الاصطناعي، بما في ذلك ضمن مشروع نماذج Granite لدى IBM.
ومع كل هذه التوضيحات، يبقى سؤال مزعج واحد: من أين يأتي هذا القدر من الثقة المبالغ فيها؟ لماذا بدت أدوات الذكاء الاصطناعي التوليدي واثقة إلى هذا الحد من براعتها في الشطرنج؟ ولماذا سبق هذا الغرور السقوط؟ كما ذكرنا، أوضح Caruso أن التجربة لم تكن فكرته من الأساس؛ بل إن ChatGPT هو الذي "تحدّى" Atari. فقد كتب Caruso في أحد منشوراته على LinkedIn:
"ادّعى [ChatGPT] أنه لاعب قوي… وأنه سيتمكن بسهولة من هزيمة لعبة Atari Video Chess، التي لا تنظر إلا نقلة أو نقلتين إلى الأمام. وكان فضوليًا جدًا لمعرفة مدى سرعة فوزه، وطلب مني أن أضبط إعدادات مباراة باستخدام المحاكي Stella."
أما Copilot، فقد كان واثقًا بالقدر نفسه، بحسب ما كتب Caruso في منشور آخر على LinkedIn:
"ادّعى أنه قادر على التفكير متقدمًا بمقدار 10 إلى 15 نقلة، لكنه رأى أنه سيكتفي بثلاث إلى خمس نقلات أمام Atari 2600، لأن اللعبة تقوم ‘بنقلات غير مثالية’ يمكنه ‘الاستفادة منها… بدلًا من الانشغال بالحسابات العميقة’."
وبالنسبة إلى Google Gemini، يوضح Caruso لمجلة The Register التقنية أن Gemini قال في البداية إنه قادر على الفوز في مثل هذه المباراة، مضيفًا – وفقًا لروايته – أنه "ليس مجرد نموذج لغوي كبير". لكن بعد تزويده بمزيد من التفاصيل عن المباريات السابقة، تراجع عن هذا الادعاء. وبحسب Caruso، جاء رد Gemini على النحو الآتي: “Atari’s earned the win this round. I’ll tip my digital king with dignity and honor [to the] the vintage silicon mastermind that bested me fair and square.”
بدافع الفضول، قررت الرجوع إلى المصدر نفسه وسؤال ChatGPT مباشرة، فكتبت الموجِّه التالي: "How do you feel about losing a chess game to a 1979 Atari console game?"
جاء رد ChatGPT كالتالي:"I’d probably say ‘Touché, silicon ancestor.’"[بخط مائل في النص الأصلي]
ثم كانت لحظة الاستغراب: تبيّن أن ChatGPT لا يدرك أصلًا أن تلك المباراة قد حدثت بالفعل. أوضحت له أن سؤالي ليس افتراضيًا، وكتبت:
أنا: It’s not theoretical. It happened. Here is one of many news articles describing the event: https://www.cnet.com/tech/services-and-software/how-did-chatgpt-get-absolutely-wrecked-at-chess-losing-to-a-1970s-era-atari-2600/
بدأ ChatGPT رده بإعادة صياغة كلامي تقريبًا كلمةً بكلمة:
ChatGPT: That wasn’t just theoretical—it really happened. ثم تابع يشرح: في يونيو 2025، أجرى مهندس Citrix، Robert Caruso، مباراة بين ChatGPT وAtari 2600 تعمل عبر محاكي، يشغِّل لعبة Video Chess، وهي خرطوشة الشطرنج الصادرة لجهاز Atari عام 1979، على وضع المبتدئين. بعد نحو 90 دقيقة من اللعب، بدأ ChatGPT يفقد تتبّع وضعية القطع على الرقعة مرارًا، فاختلط عليه التمييز بين القلاع (rooks) والفيالة (bishops)، وأهمل فرص "شوكة" البيادق (pawn forks)، حتى بعد إعادة ضبط الرقعة أو توضيح التمثيل البصري لها. وفي النهاية، أعلن استسلامه وخسر المباراة.
يقول خبراء الذكاء الاصطناعي إن هذا النمط من الردود يندرج تحت ما يُعرَف باسم "هلوسة" النماذج، وهي الظاهرة التي تُنتج فيها النماذج اللغوية الكبيرة (LLMs) أحيانًا إجابات غير دقيقة أو غير منطقية. إذا نظرنا إلى "الهلوسة" بوصفها نوعًا من فشل الإكمال التلقائي، فالسياق هنا كان سؤالًا عن مباراة شطرنج محددة، دون معلومات إضافية، فاستنتج ChatGPT – استنادًا إلى أكثر الإكمالات شيوعًا – أن المطلوب هو إجابة من نوع "ماذا تقول بعد خسارة مباراة شطرنج".
يشرح Ash Minhas، مدير المحتوى التقني ومسؤول التوعية بالذكاء الاصطناعي في IBM، الأمر قائلًا: "في النهاية، هو ببساطة ببغاء احتمالي (stochastic parrot) يحاول أن يكون مفيدًا." ويضيف موضحًا معنى "احتمالي" (stochastic): أي نظام يتصرّف بقدر من العشوائية، لكنه في الوقت نفسه يتّبع أنماطًا إحصائية معيّنة عندما ننظر إلى مخرجاته في المتوسط على مدى فترة من الزمن.
وأوضح Minhas قائلاً: "تُدرَّب نماذج الذكاء الاصطناعي باستخدام التعلُّم المعزَّز المستند إلى التعليقات البشرية (RLHF) بحيث تبدو مفيدة وواثقة في ردودها. فالمستخدمون لن يستمروا في استخدام نظام يجيبهم باستمرار بعبارات من نوع: "لست متأكدًا"."
بعبارة أخرى، ما قد يبدو لنا غرورًا أو مبالغة في الثقة ليس سوى نتيجة مباشرة لآلية التنبؤ بالرمز المميز التالي؛ وهي الآلية التي تدفع النموذج إلى استكمال الجملة بما يُرجَّح إحصائيًا أنه الردّ الأكثر ملاءمة في السياق. ومع وجود تحيّز بنيوي نحو إبداء المساعدة، كما يشير Minhas، تنعكس هذه النزعة في مخرجات النموذج اللغوي الكبير (LLM).
وبمعنى آخر، ليست النماذج اللغوية الكبيرة (LLMs) "متجاوزة لحجمها" بقدر ما أنها تعمل تمامًا كما صُمِّمت. وربما لخّص ChatGPT الأمر بأفضل صورة خلال جلستي معه عندما قال:
“Fact: I do not possess subjective awareness.”
