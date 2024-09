Os primeiros formulários de tecnologia CAPTCHA foram desenvolvidos por vários grupos diferentes em paralelo durante o final dos anos 1990 e início dos anos 2000. Cada grupo estava trabalhando para combater o problema generalizado de hackers que usavam robôs para realizar atividades criminosas na Internet. Por exemplo, os cientistas de computadores que trabalhavam para o mecanismo de busca AltaVista queriam evitar que os robôs adicionassem endereços da web maliciosos ao banco de dados de links da empresa.

Pesquisadores da empresa de TI Sanctum registraram o primeiro sistema estilo CAPTCHA em 1997. Mas o termo CAPTCHA foi cunhado em 2003 por um grupo de pesquisadores de ciência da computação na Carnegie Mellon University, liderado por Luis von Ahn e Manuel Blum. Esta equipe se inspirou a desenvolver essa tecnologia após assistir uma palestra de um executivo da Yahoo sobre os problemas da empresa com robôs de spam que efetuavam login com milhões de contas de e-mail falsas.

Para resolver o problema da Yahoo, von Ahn e Blum criaram um programa de computador que 1) gerava uma sequência aleatória de caracteres de texto, 2) gerava uma imagem distorcida desse texto (chamada de 'código CAPTCHA'), 3) apresentava a imagem para o usuário e 4) pedia ao usuário para inserir o texto em um campo de formulário e, então, enviava essa informação clicando na caixa de seleção ao lado da frase "Não sou um robô". Pelo fato de a tecnologia de reconhecimento ótico de caracteres (OCR) da época não ser avançada o suficiente para decifrar esse texto distorcido, os robôs não conseguiram resolver o desafio CAPTCHA. Se um usuário inserisse a sequência de caracteres correta, assumia-se com certeza que era humano e tinha permissão para prosseguir com seu registro de conta ou envio de formulário da web.

A Yahoo implementou a tecnologia de Carnegie Mellon, exigindo que todos os usuários passassem pelo teste CAPTCHA antes de criarem um endereço de e-mail. Isso reduziu significativamente a atividade dos robôs de spam e outras empresas passaram a adotar CAPTCHAs para proteger seus formulários da web. Após um período, no entanto, os hackers usaram dados de desafios de CAPTCHA concluídos para desenvolver algoritmos capazes de resolver de forma confiável os testes de CAPTCHA. Isso marcou o início de uma batalha entre os desenvolvedores do CAPTCHA e os cibercriminosos, que promoveu a evolução da funcionalidade do CAPTCHA.

reCAPTCHA v1

Lançado por von Ahn em 2007, o reCAPTCHA v1 tinha um duplo objetivo: dificultar a resolução do desafio CAPTCHA baseado em texto para os robôs e melhorar a precisão do reconhecimento ótico de caracteres (OCR) que estava sendo usado naquela época para digitalizar textos impressos.

O reCAPTCHA alcançou o primeiro objetivo aumentando a distorção do texto exibido para o usuário e, eventualmente, adicionando linhas ao longo do texto.

Ele alcançou o segundo objetivo substituindo uma única imagem de texto distorcido gerado aleatoriamente por duas imagens de texto distorcido com palavras de textos reais digitalizados por dois programas de OCR diferentes. A primeira palavra, ou palavra de controle, era uma palavra identificada corretamente por ambos programas de OCR. A segunda palavra era uma que ambos os programas de OCR falharam em identificar. Se o usuário identificasse corretamente a palavra de controle, o reCAPTCHA 1) assumia que o usuário era humano e permitia que ele continuasse sua tarefa e 2) também assumia que o usuário havia identificado a segunda palavra corretamente e usava a resposta para verificar os resultados futuros do OCR.

Dessa forma, o reCAPTCHA melhorou a segurança anti-robô e melhorou a precisão dos textos digitalizados no archive da internet e no New York Times. Ironicamente, também ajudou a aprimorar os algoritmos de inteligência artificial e machine learning e em 2014 já era possível identificar os CAPTCHAs de texto mais distorcidos 99,8 das vezes.

Em 2009, a Google adquiriu o reCAPTCHA e começou a usá-lo para digitalizar textos para o Google Books enquanto além de oferecê-lo como um serviço a outras organizações. No entanto, à medida que a tecnologia OCR avançou com a ajuda do reCAPTCHA, o mesmo aconteceu com os programas de inteligência artificial que poderiam efetivamente resolver reCAPTCHAs baseados em texto. Em resposta, a Google lançou os reCAPTCHAs de reconhecimento de imagem em 2012, que substituíram o texto distorcido por imagens retiradas do Google Street View. Os usuários provavam que eram humanos identificando objetos do mundo real como semáforos e táxis. Além de superar o OCR dominado por robôs, esses reCAPTCHAs baseados em imagem foram considerados mais adequados para usuários de aplicativos móveis.

Google ReCAPTCHA v2: reCAPTCHA sem CAPTCHA

Em 2014, a Google lançou o reCAPTCHA v2, que substituiu os desafios baseados em texto e imagem por uma simples caixa de seleção afirmando "Não sou um robô". Quando o usuário clica na caixa de seleção, o reCAPTCHA v2 analisa as interações do usuário com as páginas da web, avaliando os fatores como velocidade de digitação, cookies, histórico do dispositivo e endereço IP para determinar se o usuário é possivelmente um humano. A caixa de seleção também é parte de como o CAPTCHA funciona: o reCAPTCHA sem CAPTCHA rastreia os movimentos do mouse do usuário enquanto ele clica na caixa. Os movimentos de um humano tendem a ser mais caóticos, enquanto os movimentos dos robôs são mais precisos. Se um reCAPTCHA sem CAPTCHA suspeitar que um usuário pode ser um robô, ele apresenta a eles um desafio CAPTCHA baseado em imagem.

ReCAPTCHA v3

O re CAPTCHA v3, que foi lançado em 2018, usa a caixa de seleção e vai além da análise de risco orientada por IA do reCAPTCHA sem CAPTCHA. O ReCAPTCHA v3 integra-se a uma página da web via API de JavaScript e é executado em segundo plano, avaliando o comportamento do usuário em uma escalar de 0,0 (provavelmente um robô) a 1,0 (provavelmente um humano). Os proprietários de websites podem definir ações automatizadas a serem acionadas em alguns momentos quando a pontuação de um usuário sugere que ele pode ser um robô. Por exemplo, comentários de blog de usuários com pontuação baixa podem ser enviados para uma fila de moderação quando clicarem em "enviar" ou os usuários com pontuação baixa podem ser solicitados a realizar um processo de autenticação multifator quando tentarem entrar em uma conta.

Ao remover desafios interativos do processo de verificação do CAPTCHA, os métodos de autenticação baseados em IA como o reCAPTCHA v3 buscam eliminar o problema de hackers que usam dados de desafios resolvidos anteriormente para treinar robôs para solucionar novos CAPTCHAs. Por causa disso, os especialistas acreditam que os CAPTCHAs baseados em IA podem se tornar um padrão, substituindo completamente os CAPTCHAs baseados em desafios nos próximos 5 a 10 anos.