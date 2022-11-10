1990年代後半から2000年初頭にかけて、複数のさまざまなグループが初期の形態のCAPTCHAテクノロジーを並行して開発しました。各グループは、インターネット上の悪質なアクティビティーにボットを使用するハッカーが蔓延している問題への対処に取り組みました。例えば、検索エンジンのAltaVistaに取り組んでいたコンピューター・サイエンティストは、ボットが会社のリンク・データベースに悪意あるWebアドレスを追加しないようにしたいと考えていました。

IT企業、Sanctum社の研究者は、1997年に初のCAPTCHA方式システムを送り出しましたが、初めて2003年にCAPTCHAという用語を導入したのは、Luis von Ahn氏とManuel Blum氏が率いる、カーネギー・メロン大学のコンピューター・サイエンス研究者グループでした。同グループは、何百万もの偽のEメール・アカウントに登録するスパムボットの問題に関する、Yahoo社幹部の講演に触発されて、このテクノロジーに取り組むことにしました。

Yahoo社の問題を解決するため、von Ahn氏とBlum氏が開発したコンピューター・プログラムは次のものです。

ランダムな文字列を生成する テキストの歪んだ画像（「CAPTCHAコード」と呼ばれる）を生成する ユーザーにその画像を提示する フォーム・フィールドにテキストを入力し、「私はロボットではありません」という言葉の横にあるチェックボックスをクリックして入力内容を送信するようユーザーに求める

当時のOCRテクノロジーは、このような歪んだテキストの解読に苦労したため、ボットはCAPTCHAのテストに合格できませんでした。ユーザーが正しい文字列を入力した場合、そのユーザーは人間であると確実に想定でき、アカウント登録またはWebフォームの送信を完了することが許可されました。

Yahoo社はカーネギー・メロン大学のテクノロジーを導入し、Eメール・アドレスに登録する前にCAPTCHAのテストに合格することを全ユーザーに求めました。これにより、スパムボットの活動が大幅に減少し、他の企業はWebフォームを保護するためにCAPTCHAの採用を進めました。しかし、時間が経つにつれて、ハッカーは完了したCAPTCHAのテストからのデータを使用して、CAPTCHAテストに確実に合格できるアルゴリズムを開発したのです。これをきっかけに、 CAPTCHA開発者とサイバー犯罪者との間で絶え間ない激しい競争が始まり、CAPTCHA機能の進化に拍車をかけました。

reCAPTCHA v1

2007年にvon Ahn氏によって発表されたreCAPTCHA v1には2つの目的がありました。それは、ボットによるテキストベースのCAPTCHAテストの解読をより困難にすること、そして印刷されたテキストをデジタル化するため、当時使用されていたOCRの精度を向上させることです。

reCAPTCHAは、ユーザーに表示されるテキストの歪みを強め、最終的にテキストに線を追加することで最初の目標を達成しました。

2番目の目標は、ランダムに生成された歪んだテキストの1つの画像を、2つの異なるOCRプログラムによって実際のテキストからスキャンされた2つの単語を、歪んだテキスト画像に置き換えることで達成されました。最初の単語（制御語）は、両方のOCRプログラムによって正しく識別された単語で、2つ目の単語は、両方のOCRプログラムが識別できなかった単語です。ユーザーが制御語を正しく識別した場合、reCAPTCHAはユーザーが人間であるとみなし、次のタスクの続行を許可し、さらにユーザーが2番目の単語を正しく識別したと仮定し、その応答を将来のOCR結果を検証するために使用します。

このように、reCAPTCHAはアンチボットのセキュリティを向上させ、Internet ArchiveやNew York Timesでデジタル化されるテキストの精度を向上させました。皮肉なことに、時間の経過とともに人工知能と機械学習アルゴリズムの改善にも役立ち、2014年までには、最も歪んだテキストCAPTCHAを99.8%の確率で識別できるようになりました。

2009年、GoogleはreCAPTCHAを買収し、Googleブックスのテキストをデジタル化するために使用するとともに、他の組織にもサービスとして提供を開始しました。しかし、OCR技術がreCAPTCHAの助けを借りて進歩するにつれて、テキストベースのreCAPTCHAを効果的に解決できる人工知能プログラムも進歩しました。これを受けて、Googleは2012年に画像認識reCAPTCHAを導入し、歪んだテキスト認証をGoogleストリート・ビューから取得した画像認証に置き換えました。ユーザーは、街灯やタクシーなどの現実世界の物を識別することで、人間であることを証明しました。これらの画像ベースのreCAPTCHAは、ボットによって現在展開されている高度なOCRを回避するだけでなく、モバイル・アプリケーションのユーザーにとって、より便利であると考えられていました。

Google reCAPTCHA v2: No CAPTCHA reCAPTCHA

2014年、GoogleはreCAPTCHA v2をリリースし、テキストおよび画像ベースのテストを「私はロボットではありません」という単純なチェックボックスに置き換えました。ユーザーがボックスをオンにすると、reCAPTCHA v2はユーザーのWebページとのやり取りを分析し、入力速度、Cookie、デバイス履歴、IPアドレスなどの要素を評価して、ユーザーが人間である可能性が高いかどうかを判断します。このチェックボックスはCAPTCHAの仕組みの一部でもあります。no CAPTCHA reCAPTCHAは、ユーザーがボックスをクリックする際のマウスの動きを追跡します。人間の動きはより無秩序になる傾向にありますが、ボットの動きはより正確です。ユーザーがボットである可能性が疑われる場合、画像ベースのCAPTCHAテストをユーザーに提示します。

reCAPTCHA v3

2018年にデビューしたreCAPTCHA v3は、チェックボックスを廃止し、no CAPTCHA reCAPTCHAのAI駆動型リスク分析を拡張しました。ReCAPTCHA v3は、JavaScript APIを介してWebページと統合され、バックグラウンドで実行し、ユーザーの行動を0.0（ボットの可能性が高い）～1.0（人間の可能性が高い）の尺度で採点します。Webサイトの所有者は、ユーザーのスコアがボットである可能性を示唆する特定の瞬間にトリガーされる自動アクションを設定できます。例えば、スコアの低いユーザーからブログ・コメントが「送信」されると、モデレート・キューに送信されたり、スコアの低いユーザーがアカウントにログインしようとするときに多要素認証プロセスを完了するよう求められたりする場合があります。

reCAPTCHA v3のようなAIベースの認証方法は、ハッカーの問題を回避することを目指して開発されています。CAPTCHA検証プロセスからインタラクティブなテストを削除することで、ハッカーが過去に解決したテストのデータを使用して、新しいCAPTCHAを解読するようボットをトレーニングすることを防ぎます。このため、専門家は、AIベースのCAPTCHAが標準になり、今後5年から10年でテストベースのCAPTCHAに完全に取って代わる可能性があると考えています。