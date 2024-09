Las primeras formas de la tecnología CAPTCHA fueron desarrolladas por varios grupos diferentes en paralelo a finales de la década de 1990 y principios de la de 2000. Todos ellos habían surgido para hacer frente al problema generalizado de los hackers que utilizaban bots para realizar actividades maliciosas en Internet. Por ejemplo, los científicos informáticos que trabajaban para el motor de búsqueda AltaVista querían evitar que los bots agregaran direcciones web maliciosas a la base de datos de enlaces de la empresa.

Investigadores de la compañía de TI Sanctum presentaron el primer sistema estilo CAPTCHA en 1997. Pero el término CAPTCHA fue acuñado en 2003 por un grupo de investigadores de ciencia informática de la Universidad Carnegie Mellon dirigido por Luis von Ahn y Manuel Blum. Este equipo se motivó a trabajar en esta tecnología a raíz de una conferencia de un ejecutivo de Yahoo sobre los problemas que tenía la empresa con los spambots que registraban millones de cuentas de correo electrónico falsas.

Para resolver el problema de Yahoo, von Ahn y Blum crearon un programa informático que 1) generaba una cadena de texto aleatoria, 2) generaba una imagen distorsionada de ese texto (llamada "código CAPTCHA"), 3) presentaba la imagen al usuario, y 4) pedía al usuario que introdujera el texto en un campo de formulario y enviara la respuesta haciendo clic en un recuadro de verificación situado junto a la frase "No soy un robot". Debido a que la tecnología de reconocimiento óptico de caracteres (OCR) en aquellos años no podía apenas descifrar texto distorsionado, los bots no podían resolver los CAPTCHA. Si un usuario introducía la cadena de caracteres correcta, se podía suponer de manera fiable que era humano y se le permitía completar el registro de su cuenta o el envío del formulario web.

Yahoo implementó la tecnología de Carnegie Mellon, requiriendo que todos los usuarios pasaran una prueba de CAPTCHA para poder registrar una dirección de correo electrónico. Esto redujo significativamente la actividad de los spambots, y otras empresas procedieron a adoptar CAPTCHA para proteger sus formularios web. Sin embargo, con el tiempo los hackers utilizaron datos de respuestas de CAPTCHA para desarrollar algoritmos capaces de pasar las pruebas de CAPTCHA de manera fiable. Esto marcó el comienzo de una carrera armamentística entre los desarrolladores de CAPTCHA y los ciberdelincuentes que ha impulsado la evolución de la funcionalidad de CAPTCHA.

reCAPTCHA v1

Lanzado por von Ahn en 2007, reCAPTCHA v1 tenía un doble objetivo: hacer que la prueba de CAPTCHA basada en texto fuera más difícil de descifrar para los bots y mejorar la precisión del reconocimiento óptico de caracteres (OCR) que se estaba utilizando para digitalizar textos impresos en esos momentos.

reCAPTCHA logró el primer objetivo al aumentar la distorsión del texto visualizado para el usuario y agregar líneas por todo el texto.

Logró el segundo objetivo reemplazando una única imagen de texto distorsionado generada aleatoriamente por dos imágenes de texto distorsionado con palabras escaneadas de textos reales por dos programas de OCR diferentes. La primera palabra, o palabra de control, era una palabra identificada correctamente por ambos programas OCR; la segundo palabra era una palabra que ambos programas OCR no podían identificar. Si el usuario identificaba correctamente la palabra de control, reCAPTCHA 1) asumía que el usuario era humano y le permitía continuar con su tarea, y 2) también asumía que el usuario identificaba correctamente la segundo palabra y usaba la respuesta para verificar futuros resultados de OCR.

De esta forma, reCAPTCHA mejoró la seguridad anti-bot e incrementó la precisión de los textos que se digitalizaban en Internet Archive y el New York Times (irónicamente, con el tiempo también ayudó a mejorar los algoritmos de inteligencia artificial y machine learning hasta el punto que, en 2014, podían identificar los CAPTCHA de texto más distorsionados el 99,8 % de las veces).

En 2009, Google adquirió reCAPTCHA y empezó a utilizarlo para digitalizar textos para Google Books, además de ofrecerlo como servicio a otras organizaciones. Sin embargo, a medida que la tecnología OCR avanzaba con la ayuda de reCAPTCHA, también lo hacían los programas de inteligencia artificial que podían resolver de manera efectiva los reCAPTCHA basados en texto. En respuesta, Google introdujo los reCAPTCHA de reconocimiento de imágenes en 2012, que sustituían el texto distorsionado por imágenes tomadas de Google Street View. Los usuarios demostraban que eran humanos identificando objetos del mundo real, como semáforos y taxis. Además de eludir el OCR avanzado ya desplegado por bots, estos reCAPTCHA basados en imágenes resultaban más cómodos para los usuarios de aplicaciones móviles.

Google ReCAPTCHA v2: No CAPTCHA reCAPTCHA

En 2014, Google lanzó reCAPTCHA v2, que reemplazaba las pruebas basadas en texto e imágenes por un simple recuadro de verificación con el texto "No soy un robot ". Cuando el usuario marca el recuadro, reCAPTCHA v2 analiza las interacciones del usuario con las páginas web, evaluando factores como la velocidad de escritura, las cookies, el historial del dispositivo y la dirección IP para determinar si un usuario es humano. El recuadro de verificación también forma parte del funcionamiento del CAPTCHA: no CAPTCHA reCAPTCHA rastrea los movimientos de ratón del usuario cuando hacen clic en el recuadro. Los movimientos de un humano tienden a ser más caóticos, mientras que los movimientos de los bots son más precisos. Si no CAPTCHA reCAPTCHA sospecha que un usuario puede ser un bot, le presenta una prueba de CAPTCHA basada en imágenes.

ReCAPTCHA v3

reCAPTCHA v3, que debutó en 2018, elimina el recuadro de verificación y amplía el análisis de riesgos basado en IA de no CAPTCHA reCAPTCHA. ReCAPTCHA v3 se integra en una página web a través de la API de JavaScript y se ejecuta en segundo plano, calificando el comportamiento de un usuario en una escala de 0,0 (probablemente un bot) a 1,0 (probablemente un humano). Los propietarios de sitios web pueden definir acciones automatizadas para que se activen en determinados momentos cuando la puntuación de un usuario sugiera que podría ser un bot. Por ejemplo, los comentarios en un blog de usuarios con una puntuación baja pueden enviarse a una cola de moderación cuando hacen clic en "enviar", o se les puede pedir a los usuarios con una puntuación baja que completen un proceso de autenticación de múltiples factores cuando intentan iniciar sesión en un cuenta.

Al eliminar las pruebas interactivas del proceso de verificación de CAPTCHA, los métodos de autenticación basados en IA como reCAPTCHA v3 tratan de eludir el problema de los hackers que usan datos de pruebas resueltas previamente para entrenar a los bots para descifrar los nuevos CAPTCHA. Debido a esto, los expertos creen que es probable que los CAPTCHA basados en IA se generalicen y lleguen a reemplazar por completo a los CAPTCHA basados en pruebas en los siguientes 5 a 10 años.