هل يستطيع الإنترنت، كما نعرفه اليوم، أن يصمد في عصر الذكاء الاصطناعي؟ تؤمن Cloudflare بأن ذلك ممكن، على الأقل عندما يتعلّق الأمر بحماية منشئي المحتوى. وبوصفها شركة تقنية كبرى تسهم في إدارة وتأمين ما يقرب من 20% من حركة المرور على الويب، أعلنت هذا الأسبوع أنها ستكون أول مزوّد للبنية التحتية للإنترنت يحظر برامج الذكاء الاصطناعي الآلية التي تجوب المواقع لجمع المحتوى من دون إذن أو مقابل.
وقد لاقت هذه الخطوة ترحيبًا من مؤسسات إعلامية كبرى مثل The Atlantic وFortune وTIME وThe Associated Press، إضافة إلى شركات تقنية مثل Pinterest وReddit، ووصَفها Matthew Prince، Cofounder والرئيس التنفيذي لشركة Cloudflare، بأنها خطوة أولى نحو إنشاء سوق قائم على نموذج "الدفع مقابل عملية الجمع الآلي للمحتوى" (pay per crawl).
كتب قائلًا: "إن Cloudflare، إلى جانب غالبية الناشرين وشركات الذكاء الاصطناعي الرائدة عالميًا، تعمل على تغيير الإعدادات الافتراضية بحيث يُحجَب وصول برامج الذكاء الاصطناعي الآلية إلى المحتوى ما لم تدفع لمنشئي هذا المحتوى." "فهذا المحتوى هو الوقود الذي يحرّك محركات الذكاء الاصطناعي، ومن ثَمَّ فمن الإنصاف أن يحصل منشئو المحتوى على تعويض مباشر عنه."
"ولكن هذه مجرد بداية." والخطوة التالية هي العمل على إنشاء سوق يمكن فيه لمنشئي المحتوى وشركات الذكاء الاصطناعي، كبيرة كانت أو صغيرة، أن يلتقوا ويتعاملوا معًا. لقد كان حجم الزيارات دائمًا مؤشرًا ضعيفًا على القيمة الفعلية. ونعتقد أننا قادرون على تقديم نموذج أفضل."
ومع صعود الذكاء الاصطناعي التوليدي وحلول البحث المدعومة بالذكاء الاصطناعي من Anthropic وOpenAI وMeta وPerplexity، يشهد الويب نوعًا جديدًا من الزوّار: برامج آلية مخصّصة لجمع المحتوى. ولا يقتصر تأثير هذا التحوّل على ناشري الأخبار الذين يعتمدون على زيارات الإحالة لتحقيق الدخل من عملهم الصحفي، بل يشمل أيضًا منشئي المحتوى والمنصات التقنية الكبرى. فعلى سبيل المثال، رفعت Reddit مؤخرًا دعوى قضائية ضد Anthropic تزعم فيها أن برامجها الآلية تجمع محتوى المنصّة من دون إذن، وهو ما تنفيه Anthropic.
وقال Will Allen، رئيس قسم التحكم بالذكاء الاصطناعي والخصوصية ومنتجات الإعلام في Cloudflare، في مقابلة مع IBM Think: "شركات التقنية تتأثر هي الأخرى ببرامج الذكاء الاصطناعي الآلية التي تُستخدَم للوصول إلى المحتوى على الويب." ويضيف: "تُعَد منصات مثل Pinterest وQuora وReddit من أبرز مواقع المحتوى الذي ينشئه المستخدمون والتي انضمّت لدعم نهجنا القائم على الإذن المسبق لبرامج الذكاء الاصطناعي الآلية التي تجمع المحتوى، إلى جانب شركات في مجال الذكاء الاصطناعي مثل ProRata AI وHyperscience."
ولا تُستخدَم هذه البرامج الآلية لتدريب نماذج الذكاء الاصطناعي فحسب، بل تؤدي أيضًا دورًا رئيسيًا في التوليد المعزز بالاسترجاع (RAG)، الذي يربط نماذج الذكاء الاصطناعي التوليدي بقواعد معرفة خارجية، مثل المحتوى المتاح للجمهور على الإنترنت. وبحسب تقرير أصدرته الشهر الماضي شركة التقنية TollBit، ارتفع حجم حركة البرامج الآلية المرتبطة بالتوليد المعزز بالاسترجاع (RAG) على مواقع شركائها بنسبة 49%، أي ما يقرب من ضعفيْن ونصف معدل نمو حركة البرامج الآلية المخصَّصة للتدريب، الذي بلغ 18%. ومن بين أكثر 12 برنامجًا آليًا نشاطًا في زيارة مواقع الويب لجمع المحتوى، وجدت TollBit أن ChatGPT وMeta وPerplexity كانت الأكثر نشاطًا في الربع الأول من عام 2025، إذ شكّلت مجتمعةً نحو 70% من متوسط عمليات جمع المحتوى الشهري التي تنفّذها برامج الذكاء الاصطناعي الآلية.
وتؤثر حركة البيانات الجديدة هذه على الخوادم وتزيد من تكاليف البنية التحتية للناشرين. في أبريل، أشارت Wikimedia، المنظمة غير الربحية التي تقف وراء Wikipedia، إلى أن 65% من الزيارات الأعلى تكلفة لديها مصدرها البرامج الآلية (bots).وكتبت المنظمة في منشور مدونة: "محتوانا مجاني، لكن بنيتنا التحتية ليست كذلك".
كما أثّرت البرامج الآلية الشرهة للبيانات في معدلات النقر على صفحة نتائج محركات البحث (SERP)، التي شهدت تراجعًا حادًا خلال الأشهر الأخيرة. ولنأخذ على سبيل المثال ميزة Google المسماة AI Overviews؛ إذ تُظهر دراسة حديثة أجرتها شركة التسويق Ahrefs أن AI Overviews، وهي ميزة طرحها محرك البحث العملاق لجميع المستخدمين في مايو الماضي، خفّضت عدد النقرات بنسبة 34.5%. ورغم أن استخدام AI Overviews يواصل النمو – بنسبة 116% منذ مارس الماضي – فإن المواقع التي تظهر في صفحة النتائج تتعرض لخسارة واضحة.
وقال Prince من Cloudflare في مقابلة حديثة على CNBC: "ما يعنيه ذلك هو أنه إذا كنت تجني المال من الاشتراكات أو الإعلانات أو أي من النماذج التي يعتمد عليها منشئو المحتوى اليوم، فلن يرى الزوار تلك الإعلانات. ولن يستمروا في شراء تلك الاشتراكات بعد الآن. وهذا يعني أن الاستمرار في العمل كمنشئ محتوى سيصبح أصعب بكثير".
الرسالة الإخبارية الخاصة بالمجال
احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.
سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.
لكن ليس كل الروبوتات متساوية: لكن ليس كل الروبوتات متساوية: فمع تزايد برامج الجمع الآلي للمحتوى المعتمدة على الذكاء الاصطناعي، نشهد أيضًا زيادة في الروبوتات "الحسنة النية" – وأخرى مجهولة الهوية.
ويقود Lucky Gunasekara، Cofounder والرئيس التنفيذي لشركة Miso Technologies، مشروعًا باسم Project Sentinel يراقب أكثر من 8,300 موقع تعود إلى ناشرين رائدين حول العالم في مجالي الأخبار والأوساط الأكاديمية، بما في ذلك Newsweek وThe Guardian وUSA Today وBBC. وبحسب الأرقام التي جُمِعت لصالح المشروع – كما أوضح Gunasekara في حديثه مع IBM Think – يوجد أكثر من 1,700 روبوت ضمن نطاق رصد نحو 7,000 جهة نشر. وقد ارتفع هذا الرقم بنسبة 35% منذ فبراير، في حين يستهدف معظم الناشرين، من خلال سياساتهم وأدواتهم، نحو 17 برنامجًا آليًا فقط.
يقول في مقابلة: "نحن نتحدّث مع عدد كبير من الناشرين، والسؤال الأساسي هو: كيف نعرف أن هذا النهج ينجح فعليًا عندما يتعلّق الأمر بالجهات الخبيثة الأصغر حجمًا؟" ويشير إلى أنه، حتى بين أكبر الروبوتات التي يراقبها، وجد عددًا منها لا يمكن ربطه بأي من شركات الذكاء الاصطناعي الكبرى. ويتساءل: "ماذا يمكننا أن نفعل عندما تشتري جهة خبيثة 100,000 عنوان IP تُسخَّر جميعها لتشغيل روبوتات لجمع المحتوى؟"
كما يميّز Allen بين "مشغّلي برامج الاستكشاف الآلي والروبوتات والوكلاء ذوي النوايا الحسنة، الذين يبحثون عن طريقة واضحة لتعريف برامجهم لمالكي المواقع"، وبين الجهات الخبيثة. ويقول: "إن المقترحات التي نقدّمها والدعم الذي نوفره لمعيار WebAuthn [مصادقة الويب] ما زالت تحظى بالكثير من التأييد والتعاون عبر النظام البنائي للتقنية."
ويضيف: "عندما تحاول الجهات الخبيثة الوصول إلى محتوى مواقع الويب على نطاق واسع، فإنها في الغالب تستخدم أدوات وأطر عمل يمكننا تمييز بصمتها الرقمية. ونحن نستفيد من شبكة Cloudflare، التي تتعامل في المتوسط مع أكثر من 57 مليون طلب في الثانية، لفهم مستوى الثقة الذي ينبغي أن نمنحه لتلك البصمة." "نقوم باحتساب مؤشرات مجمّعة على مستوى عالمي استنادًا إلى عدد كبير من الإشارات، وبناءً على هذه الإشارات تتمكّن نماذجنا من رصد وتصنيف حركة البيانات الصادرة عن روبوتات الذكاء الاصطناعي التي تحاول جمع المحتوى بدقة وبصورة متّسقة."
ليست Cloudflare أول شركة تحاول "التفاوض" نيابة عن منشئي المحتوى. فقد شهد العام الماضي ظهور شركات مثل ScalePost وTollBit التي قدّمت حلولًا تمكّن الناشرين من مراقبة البيانات التي تُستخدَم لصالح شركات الذكاء الاصطناعي وبيعها أو تحويلها إلى مصدر دخل.
غير أن المكانة القوية التي تتمتع بها Cloudflare في السوق قد تجعل خطوتها أكثر تأثيرًا.
ويقول Gunasekara: "لو أردنا تحديد الجهة الأفضل تموضعًا للقيام بهذا الدور، فستكون Cloudflare."
"من المهم أننا نشهد واحدة من أولى الخطوات الكبيرة التي يتخذها الناشرون للوقوف في وجه هذه الشركات. أما التحدّي الحقيقي فيكمُن في أننا لا نعرف بعد ما إذا كانت شركات الذكاء الاصطناعي ستحاول التحايل على هذه الإجراءات." وفق ما صرَّحت به Lily Ray، خبيرة تحسين محركات البحث ونائبة الرئيس في Amsive، في مقابلة مع IBM Think. قد لا يدرك كثير من منشئي المحتوى بالضرورة تبعات اعتماد الحظر كخيار افتراضي؛ فليس الجميع يرغب أصلًا في أن يختفي من نتائج البحث المعتمدة على الذكاء الاصطناعي. وتوضح قائلة: "هذا النهج ينطوي على قدر من الخطورة بالنسبة للمواقع التي لا تستوعب تمامًا ما يترتب عليه من آثار."
وتشير Cloudflare إلى أن أمام الناشرين خيار السماح لبرامج الذكاء الاصطناعي الآلية التي تجمع المحتوى بالوصول إلى موادهم لأغراض التدريب أو البحث أو الاستدلال. كما يمكن لعملاء Cloudflare الحاليين حجب روبوتات الذكاء الاصطناعي في أي وقت بنقرة واحدة من لوحة المعلومات الخاصة بهم.
ويوضح Allen: "يمكن للعملاء أن يسمحوا لشركة Cloudflare بإنشاء ملف robots.txt وإدارته، بحيث تُضاف إليه الإدخالات المناسبة التي تُعلِم هذه الروبوتات بعدم الوصول إلى مواقعهم لأغراض تدريب نماذج الذكاء الاصطناعي. ويمكن للعملاء أيضًا اختيار حظر روبوتات الذكاء الاصطناعي فقط عن الأجزاء من مواقعهم التي يحققون منها الدخل عبر الإعلانات."
وقد تحظى مسألة تنظيم التبادلات بين شركات الذكاء الاصطناعي والناشرين بتغطية واسعة في الوقت الحالي مع ظهور مختبرات جديدة للذكاء الاصطناعي وتدفق الاستثمارات، لكنها في الواقع ليست قضية جديدة، كما يوضح Eric Goldman، أستاذ القانون في Santa Clara University School of Law في Silicon Valley، الذي درس في التسعينيات نموذج "الوسيط المعلوماتي" (infomediary) في الحقبة التي بدأ فيها الإنترنت يتشكّل بالصورة التي نعرفها اليوم.
ويقول في حديثه مع IBM Think: "قد تكون التقنيات اليوم مختلفة أو أكثر تطورًا، لكن الموضوع الذي نناقشه الآن ليس جديدًا."
ويضيف: "لقد نوقشت هذه الإشكالية على مدى عقود، ولم ينجح أحد حتى الآن في بناء نموذج وسيط معلوماتي فعّال، رغم ضخ مليارات الدولارات من الأموال السهلة تقريبًا للتعامل مع هذه المشكلة في التسعينيات. لذلك قد تكون Cloudflare قد توصّلت إلى صيغة عملية لهذا النموذج، وربما تنجح في تطبيقه، لكن السجل التاريخي في هذا المجال لا يدعو إلى كثير من التفاؤل."
وكان Goldman قد نشر العام الماضي ورقة بحثية حول هذا الموضوع بعنوان "Generative AI is Doomed"، ويرى أن الاستجابات التنظيمية والقانونية السائدة حاليًا تجاه الذكاء الاصطناعي التوليدي ستحدّ من فوائده بدرجة كبيرة، وربما تلغيها تمامًا.
المشهد القانوني لا يزال في طور التشكّل، ويتوقف كثيرًا على مآلات الدعاوى القضائية المتعددة التي رفعها مؤلفون وناشرون ضد شركات الذكاء الاصطناعي الكبرى في الولايات المتحدة وحول العالم. ويقول Goldman: "حتى الآن لدينا ما يدعو إلى الاعتقاد بأن القاعدة الافتراضية هي أن تدريب نموذج للذكاء الاصطناعي التوليدي على أعمال محمية بحقوق نشر لا يُعَد في حد ذاته انتهاكًا، لكن هذه القضايا جميعها ستُطرَح أمام محاكم الاستئناف. وإلى أن نبدأ في الحصول على أحكام استئناف، ستظل مجرد نقاط بيانات أولية."
IBM® ™Granite هي مجموعة من نماذج الذكاء الاصطناعي المفتوحة والموثوقة وذات الأداء العالي والتي صُمِمَت خصيصًا للأعمال وجرى الارتقاء بها على النحو الأمثل لتوسيع نطاق تطبيقات الذكاء الاصطناعي لديك. استكشف خيارات اللغة والتعليمات البرمجية والسلاسل الزمنية وضوابط الحماية.
اكتشف كيف يمكن أن تساعدك معالجة اللغة الطبيعية على التحدث بشكل أكثر طبيعية مع أجهزة الكمبيوتر.
لقد قمنا باستطلاع آراء 2000 مؤسسة حول مبادرات الذكاء الاصطناعي لديها لمعرفة ما ينجح وما لا ينجح وكيف يمكنك المضي قدمًا.
استكشف الموقع الإلكتروني لمطوري IBM للوصول إلى المدونات والمقالات والنشرات الإخبارية وتعرف على المزيد عن الذكاء الاصطناعي القابل للتضمين من IBM.
يمكنك بسهولة تصميم مساعدي ووكلاء الذكاء الاصطناعي القابلين للتوسع وأتمتة المهام المتكررة وتبسيط العمليات المعقدة باستخدام IBM watsonx Orchestrate.
تسريع قيمة الأعمال باستخدام مجموعة قوية ومرنة من مكتبات وخدمات وتطبيقات الذكاء الاصطناعي.
أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.
يمكنك بسهولة تصميم مساعدي ووكلاء الذكاء الاصطناعي القابلين للتوسع وأتمتة المهام المتكررة وتبسيط العمليات المعقدة باستخدام IBM watsonx Orchestrate.