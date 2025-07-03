私たちが知っているインターネットは、AI時代を乗り越えることができるのでしょうか。Cloudflare社は、少なくともコンテンツ作成者を保護することに関しては、それが可能であると信じています。Webの20％のトラフィックの管理と保護を支援しているテクノロジー企業は今週、報酬や許可なしにサイトをスクレイピングするAIクローラーをブロックする最初のインターネット・インフラストラクチャー・プロバイダーになると発表しました。
The Atlantic、Fortune、TIME、The Associated Pressなどの大手メディア企業や、PinterestやRedditなどのテクノロジー企業にも歓迎されたこの動きは、「クロールごとの課金」マーケットプレイスの構築に向けた第一歩であると、Cloudflare社の共同創設者兼CEOであるMatthew Prince氏は記しています。これは「ペイ・パー・クロール」市場を構築するための第一歩です。
「Cloudflare社は、世界有数のパブリッシャーやAI企業の大半とともに、クリエイターにコンテンツに対して身代金を支払わない限り、AIクローラーをデフォルトでブロックする仕様に変更しています」と彼は言います。「そのコンテンツはAIエンジンを動かす燃料であり、コンテンツ作成者がそのコンテンツに対して直接報酬を受け取るのは当然のことと言えます」
「しかし、それはほんの始まりに過ぎません。」次に、大小を問わず、コンテンツ・クリエーターとAI企業が一緒になれるマーケットプレイスに取り組みます。交通は常に価値の代替手段としては不十分でした。私たちはもっと良いことができると考察します。」
Anthropic、OpenAI、Meta、Perplexityによる生成AIとAI検索の台頭により、ウェブにはボット・スクレイパーという新しいタイプの訪問者が現れつつあります。この変化は、ジャーナリズムを収益化するために紹介トラフィックに依存しているニュース・パブリッシャーだけでなく、コンテンツ・クリエーターや大手テクノロジー・プラットフォームにも影響を与えています。ある例ではRedditがAnthropicを相手取って訴訟を起こし、ボットがコンテンツをスクレイピングしていると主張しましたが、Anthropicはこれを否定しています。
「テクノロジー企業もAIの影響を受けます」と、Cloudflare社のAIコントロール、プライバシー、メディア製品責任者であるWill Allen氏はIBM® Thinkとのインタビューで考察しています。「Pinterest、Quora、Redditは、ProRata AIやHyperscienceなどのAI分野の企業とともに、AIクローラーに対する当社のパーミッションベースのアプローチのサポートに署名した、最も人気のあるユーザー生成コンテンツ技術サイトの一部です。」
チャットボットはトレーニングだけでなく、検索拡張生成（RAG）にも使用されます。検索拡張生成（RAG）は、生成AIモデルをインターネット上の一般公開コンテンツなどの外部知識ベースに接続します。技術系企業であるTollBit社が先月発表した報告書によると、パートナーのサイトで観測されたRAGチャットボットのトラフィックは49％増加し、トレーニングチャットボットのトラフィックの約2.5倍の18％となりました。ボット・クロールWebサイトの上位12社のうち、TollBit社は、2025年第1四半期には、ChatGPT、Meta、Perplexityが最もアクティブで、AIボットによる月間平均スクレイピングの約70％を占めていることを明らかにしました。
この新しいトラフィックはサーバーに負担をかけ、パブリッシャー・インフラストラクチャーのコストも増加しています。4月、ウィキペディアを運営する非営利団体ウィキメディアは、最も高価なトラフィックの65％がチャットボットによるものだと指摘しました。「私たちのコンテンツは無料ですが、インフラストラクチャーはそうではありません」と同組織はブログ記事で述べています。
データを大量に消費するボットは、検索エンジン結果ページ（SERP）でのクリックスルー率にも影響を及ぼしており、ここ数か月で急激に減少しています。GoogleのAI Overviewを例にとると、マーケティング企業Ahrefs社の最近の調査（）によると、昨年5月に検索大手が全ユーザーに導入した製品「AI Overview」は、クリック数を34.5％減少させたことが示されています。AI Overviewsは昨年の3月から116％成長し続けていますが、SERPで提供されているサイトは打撃を受けています。
「つまり、サブスクリプションや広告など、コンテンツ作成者が現在行っているあらゆることを通じて収益を得ている場合、訪問者はその広告を見ることはないということです」と、Cloudflare社のPrince氏は最近CNBCのインタビューで述べました。「彼らはもうサブスクリプションを購入しないでしょう。つまりコンテンツ・クリエーターになるために非常な困難があるということです」
しかし、すべてのチャットボットが同じではありません。AIクロールボットの台頭により、善意のチャットボットと未知のチャットボットも増加しています。
Miso Technologies社の共同設立者兼CEOであるLucky Gunasekara氏は、Project Sentinelを率い、Newsweek、The Guardian、USA Today、BBCなど、ニュースや学術分野の世界中の主要出版社の8,300以上のサイトを監視しています。このプロジェクトのために収集された数値によると、Gunasekara氏がIBM® Thinkと共有した7,000のパブリッシャーのレーダーには、1,700以上のチャットボットが搭載されています。ほとんどのパブリッシャーがターゲットにしているチャットボットは17個のみであるにもかかわらず、この数字は2月以降35％増加しています。
「私たちは多くのパブリッシャーと話をしていますが、小規模で悪意のある行為者に対して、これがどのように機能しているのかをどのように把握しているかが疑問です」と彼はインタビューで語りました。彼が監視した最大のチャットボットの中に、大手AI企業に関連付けられていないものもいくつかありました。「悪意のある人物が10万個のIPアドレスを購入した場合、それらが単なるボットの集まりに過ぎないとしたら、私たちはどう対処すればよいのでしょうか。」と彼は尋ねました。
Allen氏はまた、サイト所有者が悪意のある行為者であることを証明するための明確な方法を必要とする「クローラー、チャットボット、エージェントの善意のオペレーター」を区別しています。「当社のWebAuthn [Web認証]の提案とサポートは、技術エコシステム全体で多くのサポートと協力を受け続けています」と彼は言います。
「悪意のある攻撃者がWebサイトを大規模にクロールしようとするとき、彼らは一般的に私たちが把握できるツールやフレームワークを使用します。私たちは、指紋をどの程度信頼すべきかを理解するために、毎秒平均5,700万件以上のリクエストを処理するCloudflare社のネットワークを使用しています」と彼は付け加えました。「私たちは多くのシグナルにわたるグローバルな集計を計算します。これらのシグナルに基づいて当社のモデルは、回避的なAIチャットボットからのトラフィックに一貫した適切なフラグを立てることができます。」
Cloudflare社は、コンテンツ作成者に代わって「交渉」に挑戦した最初の企業ではありません。過去1年間には、ScalePost社やTollBit社などの企業が出現し、パブリッシャーがAI企業向けのデータを監視、販売、または収益化するためのソリューションを提案しています。
しかし、Cloudflare社のうらやましいほどの市場は、その動きをより大きなものにする可能性があります。
「最も有利な立場にあるグループを挙げるとしたら、それはCloudflare社でしょう」とGunasekara氏は言います。
「私たちは、パブリッシャーが企業に立ち向かう大きな最初の一歩を踏み出すことは重要なのです。難しいのは、AI企業がそれを回避するかどうかわからないことです」と、SEOの専門家でありAmsive社副社長であるLily Ray氏は、IBM® Thinkとのインタビューで述べています。多くのコンテンツ作成者はデフォルトでのブロックの影響を必ずしも理解しているわけではありません。結局のところ、誰もがAI検索から消えたいと考えているわけではないのです。「意味を理解していないサイトは少し危険です」と言います。
Cloudflare社によると、パブリッシャーには、トレーニング、検索、推論のためにコンテンツにアクセスできるようにするオプションがあります。既存のお客様は、Cloudflareダッシュボードで1回クリックするだけで、いつでもAIクローラーをブロックできます。
「お客様はRobots.txtファイルの作成と管理をCloudflare社に任せることができます。このファイルにより、クローラーにAIトレーニングのためにサイトにアクセスしないように適切なエントリーが作成されます」とAllen氏は説明します。「お客様は、広告を通じて収益化されているサイトの一部でのみ、AIチャットボットをブロックすることを選択できます。」
AI企業とパブリッシャー間の取引を規制するという問題は、新しいAIラボが出現し、投資が流れている現在、多くの記事で取り上げられるかもしれません。しかし、これは新しい概念ではありませんと、シリコンバレーにあるサンタクララ大学ロースクールのEric Goldman教授は指摘しています。同教授は、インターネットが誕生した1990年代に「インフォメディアリー」モデルを研究しました。
「テクノロジーは今と異なっている、あるいは進化しているかもしれませんが、今日私たちが話していることは新しいものではありません」と彼はIBM® Thinkに語りました。
「この問題は何十年も前から議論されてきましたが、1990年代のこの問題では何十億ドルもの簡単に資金が投入されましたが、まだ誰もインフォメディア・モデルの構築に成功した人はいません。つまり、Cloudflare社はモデルの欠陥を回避できた可能性があります。実現できるかもしれませんが、この分野の歴史的な実績は優れたものではありません。」
Goldman教授は昨年、このテーマに関する論文「Generative AI is Doomed（生成AIは破滅的）」を発表しました。同氏によると、生成AIに対する一般的な規制や法的対応により、生成AIのメリットが制限され、あるいは無効になるといいます。
米国および世界各国において、著者や出版社によって主要なAI企業を相手取って提起された様々な訴訟の結果によって、法的な枠組みは依然として形作られなければなりません。「これまでのところ、デフォルト・ルールは、著作権で保護された作品を使って生成AIモデルをトレーニングすることは違反ではないと考える理由がありますが、これらの問題はすべて、異議申し立てを受けることでしょう」とGoldman教授は述べています。「お詫びの裁定を取得し始めるまでは、それらは単なる初期のデータポイントに過ぎません。」
