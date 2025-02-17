قد تكون قطتك المنزلية أذكى من ChatGPT. فعلى الرغم من أن الذكاء الاصطناعي بات قادرًا اليوم على كتابة الشعر واجتياز اختبارات كليات الحقوق، فإنه لا يزال عاجزًا عن مجاراة قدرات الاستدلال الأساسية التي تمكّن قطتك من التحرك بثقة على حواف النوافذ والانقضاض بدقة على الفريسة.
هذه الفجوة ـ بين إحاطة الذكاء الاصطناعي بالمعرفة البشرية، وعجزه عن مضاهاة فهم الحيوانات للعالم المادي ـ برزت باعتبارها تحديًا محوريًا في السعي إلى تطوير آلات أكثر ذكاءً. وقد سلّط Yann LeCun، كبير علماء الذكاء الاصطناعي في Meta، الضوء على هذه المسألة الأسبوع الماضي في قمة لأمان الذكاء الاصطناعي في باريس، معتبرًا أن "النماذج العالمية" ـ وهي أنظمة للذكاء الاصطناعي تُكوِّن تمثيلات داخلية للبنية والديناميكيات والعلاقات السببية ـ يمكن أن تكون مفتاح دفع تطور الذكاء الاصطناعي.
ومع ذلك، يتساءل بعض الباحثين البارزين عمّا إذا كان هذا النهج ثوريًا بالقدر الذي يبدو عليه.
ويقول Stuart J. Russell، أستاذ علوم الكمبيوتر في University of California, Berkeley، في حديث مع IBM Think: "لقد استخدم الذكاء الاصطناعي نماذج للعالم منذ خمسينيات القرن الماضي، وتعتمد عدة مجالات فرعية في الذكاء الاصطناعي بالكامل على هذه النماذج." "لا ينطوي هذا الطرح على قدر من الجِدّة والابتكار يزيد عمّا في القول إن الرياضيات قد تكون مفيدة للفيزياء."
يسلّط هذا الجدل الضوء على سباق متصاعد لتحقيق الذكاء الاصطناعي العام (AGI)، أي أنظمة الذكاء الاصطناعي القادرة على مضاهاة مستوى التعلّم والاستدلال البشري أو تجاوزه في أي مجال تقريبًا. وعلى عكس أنظمة الذكاء الاصطناعي المتخصصة الحالية، التي تتفوّق في مهام ضيّقة مثل الشطرنج أو معالجة اللغة، يتعيّن على أنظمة الذكاء الاصطناعي العام فهم العالم على مستوى أكثر جوهرية، من خلال الجمع بين قدرات الاستدلال، وفهم العالم المادي، والقدرة على التكيّف.
وقد اتبعت شركات التقنية الكبرى مسارات مختلفة للتعامل مع هذا التحدّي. فقد ركزت OpenAI، عبر سلسلة نماذج GPT، على توسيع نطاق النماذج اللغوية الكبيرة (LLMs) من أجل الوصول إلى قدرات استدلال أكثر تعقيدًا. أمّا Google DeepMind، من خلال أنظمة مثل AlphaFold وAlphaGo، فاستهدفت مجالات محددة مع العمل في الوقت نفسه على تطوير قدرات أكثر عمومية. وفي المقابل، شددت Meta على أهمية التعلّم من التفاعل مع العالم الحقيقي، لا من النصوص وحدها.
وقال LeCun في القمة: "دعك من محاولة إعادة إنتاج الذكاء البشري؛ نحن لا نزال عاجزين حتى عن إعادة إنتاج ذكاء القطط أو الجرذان. يمكن لأي قطة منزلية أن تخطّط لسلسلة من الأفعال شديدة التعقيد."
وخلال السنوات الأخيرة، حققت أنظمة الذكاء الاصطناعي قفزات سريعة في نتائجها على المعايير المرجعية في مجالات متخصصة. لكن LeCun يشير إلى ما يسمّيه الباحثون مفارقة Moravec، وهي الملاحظة القائلة إن المهارات التي تبدو سهلة بالنسبة للبشر غالبًا ما تكون الأصعب على الآلات إتقانًا.
ويقول LeCun: "الأشياء التي نعدّها من المسلّمات لأن البشر والحيوانات يستطيعون القيام بها، نظن أنها غير معقدة، لكنها في الواقع بالغة التعقيد. في المقابل، القدرات التي نعتبرها فريدة للبشر، مثل التعامل مع اللغة وتوليدها أو لعب الشطرنج أو Go، تبيّن أنها أسهل نسبيًا على الآلات."
هذا التناقض – أن أنظمة الذكاء الاصطناعي تتفوّق في المهام التي نعدّها ذهنيًا معقدة، بينما تتعثر أمام قدرات حسية وجسدية تبدو بديهية – يثير تشكّك بعض الخبراء.
يقول Russell: "استغرقت عملية الانتقال من سلسلة من الصور التي ترِد إلى شبكية العين إلى صياغة معادلات Maxwell للكهرومغناطيسية، على سبيل المثال، عشرات الآلاف من السنين بالنسبة للبشرية، واعتمدت على مسار تراكمي من بناء المفاهيم وصياغتها رياضيًا. لم أرَ شيئًا يشبه هذا المسار في أنظمة التعلّم العميق الحالية."
وللتدليل على حدود النهج الحالي، يشير LeCun إلى مقارنة لافتة: النماذج اللغوية الكبيرة (LLMs) المعاصرة تُدرَّب على تريليونات من الرموز المميزة (tokens)، وهي كمية من النص لو حاول إنسان قراءتها لاستغرق الأمر نحو نصف مليون سنة. ومع ذلك، فإن طفلًا في الرابعة من عمره، يكون مستيقظًا لما يقارب 16,000 ساعة فقط، يعالج كمية مماثلة من البيانات تقريبًا عبر الإدراك البصري وحده.
ويقول LeCun: "الطفل في الرابعة من عمره يكون قد تعرّض لكمية من البيانات، في صورة إدراك بصري، تضاهي ما تستهلكه أكبر النماذج اللغوية. وبالنسبة للأطفال المكفوفين، يأتي هذا الإدراك عبر حاسة اللمس. وهذا يخبرنا بالكثير؛ فلن نصل أبدًا إلى مستوى ذكاء يماثل البشر إذا اقتصرنا على تدريب النماذج على النصوص فقط."
هذه الملاحظة دفعت الباحثين إلى البحث عن أساليب جديدة. وفي Meta، ذهب فريق LeCun إلى حد التخلي عن مصطلح "الذكاء الاصطناعي العام" (AGI) لصالح مصطلح "الذكاء الآلي المتقدم" (AMI). ويعلّق LeCun قائلًا: "السبب هو أن الذكاء البشري نفسه شديد التخصّص في الواقع، ولذلك فإن وصفه بالذكاء الاصطناعي العام ينطوي على قدر من عدم الدقة."
ويرى LeCun أننا بحاجة إلى إعادة التفكير جذريًا في الكيفية التي سيتطوّر بها الذكاء الاصطناعي. فبدلًا من محاولة استنساخ الدماغ البشري، يدعو إلى تغيير الطريقة التي يتعلّم بها الذكاء الاصطناعي عن العالم ويفهمه، بحيث يبني "صورته الذهنية" الخاصة عن الواقع من خلال ما يشبه الحواس، فيتعلّم مثلًا كيفية سلوك الأشياء المادية بمجرد "مشاهدة" الفيديوهات وغيرها من البيانات الحسية، لا الاعتماد على النصوص وحدها. ستحتاج هذه الأنظمة القائمة على الذكاء الاصطناعي إلى القدرة على تذكّر المعطيات بصورة متّسقة، ومعرفة كيفية تخطيط أفعالها خطوة بخطوة لإنجاز المهام.
ويختلف علماء علوم الكمبيوتر حول الكيفية التي يمكن أن تطوّر بها أنظمة الذكاء الاصطناعي فهمها الخاص للعالم. ويرى Pedro Domingos، الأستاذ الفخري في University of Washington، أن إحراز تقدم في هذا الاتجاه أمر ممكن، لكنه ليس وشيك الحدوث. ويقول في حديثه إلى IBM Think: "من الواقعي تمامًا بناء أنظمة ذكاء اصطناعي تطوّر نماذج عالم خاصة بها، لكننا لا نعرف بعد كيف يمكن تحقيق ذلك، وما زال هناك كثير من الأبحاث المطلوبة."
ولا تزال قدرات الذكاء الاصطناعي الحالية أقل من مستوى الاستدلال البشري، خصوصًا عندما يتعلق الأمر بالتعامل مع المهام المعقّدة. وكما يوضح Russell: "منذ ستينيات القرن الماضي ونحن ندرك أن استخدام نماذج عالم بسيطة وموحّدة يقود إلى مشكلات في الاستدلال والتخطيط تكاد تكون عصيّة تمامًا على المعالجة. تخيّل مثلًا أن تحاول التخطيط لإجازة عبر تحديد التسلسل الدقيق المكوّن من 800 مليون إشارة عضلية ينبغي تنفيذها سلفًا." ويشير Russell إلى أن البشر يعالجون المعلومات بطريقة مختلفة قائلًا: "الأداة الرئيسة التي يستخدمها البشر لتجاوز هذه المعضلة هي البنية الهرمية؛ فنحن نعمل مع عدد كبير من النماذج على مستويات متعدّدة من التجريد، بدءًا من الأفعال الكبرى عالية المستوى... وصولًا إلى الأفعال الصغيرة متدنية المستوى، مثل تحريك الإصبع لكتابة الحرف التالي “i” في هذا البريد الإلكتروني."
