Mehrere verschiedene Gruppen entwickelten die ersten Formen der CAPTCHA-Technologie parallel in den späten 1990er und frühen 2000er Jahren. Jede Gruppe arbeitete daran, das weit verbreitete Problem von Hackern zu bekämpfen, die Bots für kriminelle Aktivitäten im Internet einsetzen. Zum Beispiel wollten Informatiker, die für die Suchmaschine AltaVista arbeiteten, verhindern, dass Bots schädliche Webadressen zur Link-Datenbank des Unternehmens hinzufügten.

Forscher des IT-Unternehmens Sanctum entwickelten 1997 das erste CAPTCHA-ähnliche System. Der Begriff CAPTCHA wurde jedoch erstmals 2003 von einer Gruppe von Computerwissenschaftlern der Carnegie Mellon University unter der Leitung von Luis von Ahn und Manuel Blum eingeführt. Dieses Team wurde von einem leitenden Angestellten von Yahoo zur Arbeit an dieser Technologie inspiriert, der einen Vortrag über die Probleme des Unternehmens mit Spambots hielt, die sich für Millionen gefälschter E-Mail-Konten anmelden.

Um das Problem von Yahoo zu lösen, entwickelten von Ahn und Blum ein Computerprogramm, das:

eine zufällige Zeichenkette erzeugt, ein verzerrtes Bild dieses Textes generiert (ein sogenannter „CAPTCHA-Code“), das Bild dem Benutzer präsentiert, den Benutzer bat, den Text in ein Formularfeld einzugeben und dann die Eingabe durch Anklicken eines Kontrollkästchens neben der Phrase „Ich bin kein Roboter“ abzusenden.

Da die OCR-Technologie der damaligen Zeit Schwierigkeiten hatte, einen derart verzerrten Text zu entziffern, konnten Bots die CAPTCHA-Herausforderung nicht meistern. Wenn ein Benutzer die richtige Zeichenfolge eingab, konnte man davon ausgehen, dass es sich um einen Menschen handelte, und er durfte seine Kontoregistrierung abschließen oder das Webformular absenden.

Yahoo hat die Technologie von Carnegie Mellon implementiert, bei der alle Benutzer einen CAPTCHA-Test bestehen müssen, bevor sie sich für eine E-Mail-Adresse anmelden können. Dadurch wurde die Spambot-Aktivität erheblich reduziert, und andere Unternehmen führten CAPTCHAs ein, um ihre Webformulare zu schützen. Im Laufe der Zeit nutzten Hacker jedoch Daten aus abgeschlossenen CAPTCHA-Challenges, um Algorithmen zu entwickeln, die CAPTCHA-Tests zuverlässig bestehen. Dies war der Beginn eines anhaltenden Wettrüstens zwischen CAPTCHA-Entwicklern und Cyberkriminellen, das die Weiterentwicklung der CAPTCHA-Funktionalität vorangetrieben hat.

reCAPTCHA Version 1

Von Ahn startete reCAPTCHA v1 im Jahr 2007 mit einem doppelten Ziel: die textbasierte CAPTCHA-Herausforderung für Bots schwieriger zu knacken zu machen und die Genauigkeit der OCR zu verbessern, die zu dieser Zeit zur Digitalisierung gedruckter Texte verwendet wurde.

reCAPTCHA erreichte das erste Ziel, indem es die Verzerrung des dem Benutzer angezeigten Textes erhöhte und schließlich Linien durch den Text zog.

Das zweite Ziel wurde erreicht, indem ein einzelnes Bild eines zufällig generierten verzerrten Textes durch zwei verzerrte Textbilder von Wörtern ersetzt wurde, die von zwei verschiedenen OCR-Programmen aus tatsächlichen Texten gescannt wurden. Das erste Wort oder Kontrollwort war ein Wort, das von beiden OCR-Programmen korrekt identifiziert wurde. Das zweite Wort war ein Wort, das beide OCR-Programme nicht identifizieren konnten. Wenn der Benutzer das Kontrollwort richtig identifizierte, ging reCAPTCHA davon aus, dass es sich bei dem Benutzer um einen Menschen handelte, und erlaubte ihm, seine Aufgabe fortzusetzen. Außerdem ging reCAPTCHA davon aus, dass der Benutzer das zweite Wort richtig identifizierte, und verwendete die Antwort, um zukünftige OCR-Ergebnisse zu überprüfen.

Auf diese Weise verbesserte reCAPTCHA die Anti-Bot-Sicherheit und die Genauigkeit der im Internetarchiv und in der New York Times digitalisierten Texte. Ironischerweise trug es im Laufe der Zeit auch dazu bei, die Algorithmen für künstliche Intelligenz und maschinelles Lernen so weit zu verbessern, dass sie 2014 in 99,8 % der Fälle die am stärksten verzerrten Text-CAPTCHAs identifizieren konnten.

Im Jahr 2009 erwarb Google reCAPTCHA und begann, es zur Digitalisierung von Texten für Google Books zu nutzen und gleichzeitig anderen Unternehmen als Service anzubieten. Mit der Weiterentwicklung der OCR-Technologie mithilfe von reCAPTCHA entwickelten sich jedoch auch die Programme für künstliche Intelligenz weiter, die textbasierte reCAPTCHAs effektiv lösen konnten. Als Reaktion darauf führte Google 2012 die Bilderkennung reCAPTCHAs ein, bei der verzerrter Text durch Bilder aus Google Street View ersetzt wurde. Die Benutzer bewiesen ihre Menschlichkeit, indem sie reale Objekte wie Straßenlaternen und Taxis identifizierten. Diese bildbasierten reCAPTCHAs umgingen nicht nur die fortschrittliche OCR, die jetzt von Bots eingesetzt wird, sondern wurden auch als praktischer für Benutzer von mobilen Apps angesehen.

Google reCAPTCHA v2: No CAPTCHA reCAPTCHA

Im Jahr 2014 veröffentlichte Google reCAPTCHA v2, das text- und bildbasierte Herausforderungen durch ein einfaches Kontrollkästchen mit der Aufschrift „Ich bin kein Roboter“ ersetzte. Wenn Benutzer das Kästchen aktivieren, analysiert reCAPTCHA v2 die Interaktionen des Benutzers mit Webseiten und wertet dabei Faktoren wie Tippgeschwindigkeit, Cookies, Geräteverlauf und IP-Adresse aus, um festzustellen, ob es sich bei einem Benutzer wahrscheinlich um einen Menschen handelt. Das Kontrollkästchen ist auch Teil der Funktionsweise von CAPTCHA: No CAPTCHA reCAPTCHA verfolgt die Mausbewegungen des Benutzers, während er auf das Kästchen klickt. Die Bewegungen eines Menschen sind in der Regel eher chaotisch, während die Bewegungen von Bots präziser sind. Wenn no CAPTCHA reCAPTCHA den Verdacht hat, dass ein Benutzer ein Bot sein könnte, wird ihm eine bildbasierte CAPTCHA-Aufgabe gestellt.

reCAPTCHA v3

reCAPTCHA v3, das 2018 eingeführt wurde, verzichtet auf das Kontrollkästchen und erweitert die KI-gesteuerte Risikoanalyse von no CAPTCHA reCAPTCHA. ReCAPTCHA v3 wird über eine JavaScript-API in eine Webseite integriert und läuft im Hintergrund. Das Verhalten eines Benutzers wird auf einer Skala von 0,0 (wahrscheinlich ein Bot) bis 1,0 (wahrscheinlich ein Mensch) bewertet. Website-Betreiber können automatische Aktionen festlegen, die zu bestimmten Zeitpunkten ausgelöst werden, wenn die Punktzahl eines Benutzers darauf hindeutet, dass es sich um einen Bot handeln könnte. Beispielsweise können Blog-Kommentare von Benutzern mit niedriger Punktzahl an eine Moderationswarteschlange gesendet werden, wenn sie auf „Senden“ klicken, oder Benutzer mit niedriger Punktzahl können aufgefordert werden, einen mehrstufigen Authentifizierungsprozess abzuschließen, wenn sie versuchen, sich bei einem Konto anzumelden.

KI-basierte Authentifizierungsmethoden wie reCAPTCHA v3 versuchen, das Problem von Hackern zu umgehen. Indem sie interaktive Herausforderungen aus dem CAPTCHA-Verifizierungsprozess entfernen, verhindern sie, dass Hacker Daten aus zuvor gelösten Herausforderungen verwenden, um Bots darauf zu trainieren, neue CAPTCHAs zu knacken. Aus diesem Grund gehen Experten davon aus, dass KI-basierte CAPTCHAs in den nächsten fünf bis zehn Jahren zur Norm werden und herausforderungsbasierte CAPTCHAs vollständig ersetzen könnten.