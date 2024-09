Les premières formes de la technologie CAPTCHA ont été développées par plusieurs groupes différents en parallèle à la fin des années 1990 et au début des années 2000. Chaque groupe s'efforçait de lutter contre le problème répandu des pirates informatiques qui utilisaient des bots pour mener des activités néfastes sur Internet. Par exemple, des informaticiens travaillant pour le moteur de recherche AltaVista voulaient empêcher les bots d'ajouter des adresses Web malveillantes à la base de données de liens de l'entreprise.

Des chercheurs de la société informatique Sanctum ont déposé le premier système de style CAPTCHA en 1997. Mais le terme CAPTCHA a été inventé en 2003 par un groupe de chercheurs en informatique de l'Université Carnegie Mellon dirigé par Luis von Ahn et Manuel Blum. Cette équipe a été incitée à travailler sur cette technologie par un cadre de Yahoo qui avait présenté lors d'une conférence les problèmes rencontrés par l'entreprise avec les spambots qui créaient des millions de faux comptes de messagerie.

Pour résoudre le problème de Yahoo, von Ahn et Blum ont alors créé un programme informatique qui 1) générait une chaîne de texte aléatoire, 2) générait une image déformée de ce texte (appelée "code CAPTCHA"), 3) présentait l'image à l'utilisateur et 4) demandait à l'utilisateur de saisir le texte dans une zone de formulaire, puis de valider sa saisie en cochant la case située à côté de la phrase "Je ne suis pas un robot". Comme la technologie de reconnaissance optique de caractères (ROC) de l'époque avait du mal à déchiffrer un texte aussi déformé, les bots ne pouvaient pas réussir la demande d'authentification CAPTCHA. Si un utilisateur entrait la bonne chaîne de caractères, on pouvait supposer de manière fiable qu'il s'agissait d'un humain, et il était autorisé à terminer l'enregistrement de son compte ou la soumission du formulaire Web.

Yahoo a mis en œuvre la technologie de Carnegie Mellon, obligeant tous les utilisateurs à effectuer un test CAPTCHA avant de s'inscrire pour obtenir une adresse électronique. Cela a considérablement réduit l'activité des spambots, et d'autres entreprises ont adopté les CAPTCHA pour protéger leurs formulaires Web. Au fil du temps, cependant, les pirates ont utilisé les données des demandes d'authentification CAPTCHA terminées pour développer des algorithmes capables de réussir les tests CAPTCHA de manière fiable. Cela a marqué le début d'une course aux armements entre les développeurs de CAPTCHA et les cybercriminels, qui a alimenté l'évolution de la fonctionnalité CAPTCHA.

reCAPTCHA v1

Lancé par von Ahn en 2007, reCAPTCHA v1 avait un double objectif : rendre la demande d'authentification CAPTCHA textuelle plus difficile à résoudre pour les bots et améliorer la précision de la reconnaissance optique de caractères (ROC) utilisée à l'époque pour numériser les textes imprimés.

reCAPTCHA a atteint le premier objectif en augmentant la distorsion du texte affiché à l'utilisateur, puis en ajoutant des lignes dans le texte.

Il a atteint le deuxième objectif en remplaçant une seule image de texte déformé générée de manière aléatoire par deux images de texte déformé de mots numérisés à partir de textes réels par deux programmes ROC différents. Le premier mot, ou mot de contrôle, était un mot identifié correctement par les deux programmes ROC ; le deuxième mot était un mot que les deux programmes ROC n'avaient pas réussi à identifier. Si l'utilisateur identifiait correctement le mot de contrôle, reCAPTCHA 1) supposait que l'utilisateur était humain et lui permettait de poursuivre sa tâche et 2) supposait également que l'utilisateur identifiait correctement le deuxième mot, et utilisait la réponse pour vérifier les futurs résultats de la ROC.

reCAPTCHA a ainsi amélioré la sécurité anti-bot et la précision des textes numérisés dans Internet Archive et le New York Times. (Ironiquement, au fil du temps, cela a également contribué à améliorer l'intelligence artificielle et les algorithmes d'apprentissage automatique au point que, en 2014, ils pouvaient identifier les CAPTCHAs textuels les plus déformés dans 99,8 % des cas.)

En 2009, Google a acquis reCAPTCHA et a commencé à l'utiliser pour numériser des textes pour Google Books tout en le proposant comme service à d'autres organisations. Cependant, alors que la technologie ROC avait progressé avec l'aide de reCAPTCHA, il en était de même pour les programmes d'intelligence artificielle capables de résoudre efficacement les reCAPTCHA basés sur du texte. En réponse, Google a introduit en 2012 des reCAPTCHA de reconnaissance d'image, qui remplaçaient le texte déformé par des images provenant de Google Street View. Les utilisateurs prouvaient qu'ils étaient humains en identifiant des objets du monde réel comme des réverbères et des taxis. En plus d'éviter les programmes ROC avancés désormais déployés par des bots, ces reCAPTCHA basés sur des images étaient considérés comme plus pratiques pour les utilisateurs d'applications mobiles.

Google ReCAPTCHA v2 : No CAPTCHA reCAPTCHA

En 2014, Google a publié reCAPTCHA v2, qui a remplacé les demandes d'authentification basées sur le texte et l'image par une simple case à cocher indiquant "Je ne suis pas un robot." Lorsque les utilisateurs cochent la case, reCAPTCHA v2 analyse les interactions de l'utilisateur avec les pages Web, en évaluant des facteurs tels que la vitesse de frappe, les cookies, l'historique de l'appareil et l'adresse IP pour déterminer si un utilisateur est susceptible d'être humain. La case à cocher fait également partie du fonctionnement de CAPTCHA : No CAPTCHA reCAPTCHA suit les mouvements de la souris de l'utilisateur lorsqu'il clique sur la case. Les mouvements d'un humain ont tendance à être plus chaotiques, alors que ceux des bots sont plus précis. Si No CAPTCHA reCAPTCHA soupçonne qu'un utilisateur peut être un bot, il lui présente une demande d'authentification CAPTCHA basée sur une image.

ReCAPTCHA v3

reCAPTCHA v3, qui a fait ses débuts en 2018, supprime la case à cocher et développe l'analyse de risque basée sur l'IA de No CAPTCHA reCAPTCHA. ReCAPTCHA v3 s'intègre à une page Web via l'API JavaScript et s'exécute en arrière-plan, en évaluant le comportement de l'utilisateur sur une échelle de 0.0 (probablement un bot) à 1.0 (probablement un humain). Les propriétaires de sites Web peuvent définir des actions automatisées qui se déclenchent à certains moments lorsque le score d'un utilisateur suggère qu'il pourrait s'agir d'un bot. Par exemple, les commentaires de blog des utilisateurs à faible score peuvent être envoyés dans une file d'attente de modération lorsqu'ils cliquent sur "soumettre", ou ces utilisateurs peuvent être invités à effectuer un processus d'authentification multifacteur lorsqu'ils tentent de se connecter à un compte.

En supprimant les demandes d'authentification interactives du processus de vérification CAPTCHA, les méthodes d'authentification basées sur l'IA, comme reCAPTCHA v3, cherchent à contourner le problème des pirates qui utilisent les données des demandes d'authentification précédemment résolues pour entraîner les bots à déchiffrer les nouveaux CAPTCHA. C'est pour cette raison que les experts pensent que les CAPTCHA basés sur l'IA pourraient devenir la norme et remplacer complètement les CAPTCHA basés sur des demandes d'authentification dans les 5 à 10 prochaines années.