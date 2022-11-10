Vários grupos diferentes desenvolveram as primeiras formas de tecnologia CAPTCHA em paralelo durante o final da década de 1990 e início da década de 2000.

Cada grupo trabalhou para combater o problema generalizado dos hackers que usam bots para atividades nefastas na Internet. Por exemplo, os cientistas da computação que trabalhavam para o mecanismo de busca AltaVista queriam impedir que os bots adicionassem endereços da web mal-intencionados ao banco de dados de links da empresa.

Pesquisadores da empresa de TI Sanctum apresentaram o primeiro sistema de estilo CAPTCHA em 1997. No entanto, um grupo de pesquisadores de ciência da computação da Carnegie Mellon University, liderado por Luis von Ahn e Manuel Blum, introduziu o termo CAPTCHA pela primeira vez em 2003. Essa equipe foi inspirada a trabalhar na tecnologia por um executivo do Yahoo, que fez uma palestra sobre os problemas da empresa com spambots que se inscreviam para milhões de contas de e-mail falsas.

Para resolver o problema do Yahoo, von Ahn e Blum criaram um programa de computador que:

Gerava uma sequência aleatória de texto,



Gerava uma imagem distorcida desse texto (chamada de "código CAPTCHA"),



Apresentava a imagem ao usuário,



Pedia ao usuário para inserir o texto em um campo de formulário e, em seguida, enviar a entrada clicando em uma caixa de seleção ao lado da frase "Não sou um robô".



Como a tecnologia OCR da época lutava para decifrar esse texto distorcido, os bots não conseguiam ser aprovados no desafio CAPTCHA. Se um usuário inseriu a sequência correta de caracteres, pode-se presumir de forma confiável que ele era humano e tinha permissão para concluir o registro da conta ou o envio do formulário da web.

O Yahoo implementou a tecnologia da Carnegie Mellon, exigindo que todos os usuários passassem por um teste CAPTCHA antes de se inscreverem para um endereço de e-mail.

Isso reduziu significativamente a atividade de spambots, e outras empresas passaram a adotar CAPTCHAs para proteger seus formulários da web. Com o tempo, no entanto, hackers usaram dados de desafios CAPTCHA concluídos para desenvolver algoritmos capazes de fazê-los ser aprovados de forma confiável nos testes CAPTCHA. Isso marcou o início de uma corrida armamentista contínua entre desenvolvedores de CAPTCHA e cibercriminosos, que impulsionou a evolução da funcionalidade CAPTCHA.

reCAPTCHA v1

Lançado por von Ahn em 2007, o reCAPTCHA v1 tinha um duplo objetivo: tornar o desafio do CAPTCHA baseado em texto mais difícil para os bots decifrarem e melhorar a precisão do OCR usado na época para digitalizar textos impressos.

O reCAPTCHA atingiu o primeiro objetivo aumentando a distorção do texto exibido para o usuário e, eventualmente, adicionando linhas ao longo do texto.

Ele alcançou o segundo objetivo substituindo uma única imagem de texto distorcido gerado aleatoriamente por duas imagens de texto distorcidas de palavras digitalizadas de textos reais por dois programas de OCR diferentes. A primeira palavra, ou palavra de controle, era uma palavra identificada corretamente por ambos os programas de OCR. A segunda palavra era uma palavra que ambos os programas de OCR não conseguiram identificar.

Se o usuário identificou corretamente a palavra de controle, o reCAPTCHA presumia que o usuário era humano e permitia que ele continuasse sua tarefa, e também presumia que o usuário identificou a segunda palavra corretamente e usou a resposta para verificar futuros resultados de OCR.

Dessa forma, o reCAPTCHA melhorou a segurança antibot e melhorou a precisão dos textos que estavam sendo digitalizados no Internet Archive e no New York Times. Ironicamente, ao longo do tempo, também ajudou a melhorar a inteligência artificial e os algoritmos de aprendizado de máquina, a tal ponto que, até 2014, eles podiam identificar os CAPTCHAs de texto mais distorcidos em 99,8% das vezes.

Em 2009, o Google adquiriu o reCAPTCHA e começou a usá-lo para digitalizar textos para o Google Livros, oferecendo-o como um serviço a outras organizações. No entanto, à medida que a tecnologia OCR progredia com a ajuda do reCAPTCHA, também progrediam os programas de inteligência artificial que poderiam efetivamente resolver reCAPTCHAs baseados em texto. Em resposta, o Google introduziu reCAPTCHAs de reconhecimento de imagem em 2012, que substituíam texto distorcido por imagens tiradas do Google Street View.

Os usuários provavam sua humanidade identificando objetos do mundo real, como luzes de rua e táxis. Além de evitar o OCR avançado agora implementado por bots, esses reCAPTCHAs baseados em imagem eram considerados mais convenientes para usuários de aplicativos móveis.

Google reCAPTCHA v2: reCAPTCHA sem CAPTCHA

Em 2014, o Google lançou o reCAPTCHA v2, que substituía desafios baseados em texto e imagem por uma caixa de seleção simples informando "Não sou um robô".

À medida que os usuários marcavam a caixa, o reCAPTCHA v2 analisava as interações do usuário com as páginas da web, avaliando fatores como velocidade de digitação, cookies, histórico do dispositivo e endereço IP para determinar se era provável que o usuário fosse humano.

A caixa de seleção também fazia parte de como o CAPTCHA funcionava: nenhum CAPTCHA reCAPTCHA rastreava os movimentos do mouse do usuário à medida que ele clica na caixa. Os movimentos de um humano tendem a ser mais caóticos, enquanto os movimentos de bots são mais precisos. Se nenhum CAPTCHA reCAPTCHA suspeitasse de que um usuário poderia ser um bot, ele apresentaria um desafio CAPTCHA baseado em imagem.

reCAPTCHA v3

O reCAPTCHA v3, lançado em 2018, eliminava a caixa de seleção e expandia a análise de risco orientada por IA do reCAPTCHA sem CAPTCHA. O ReCAPTCHA v3 integrava-se a uma página da web por meio da API JavaScript e era executado em segundo plano, pontuando o comportamento do usuário em uma escala de 0,0 (provavelmente um bot) a 1,0 (provavelmente um humano).

Os proprietários de sites podiam definir ações automatizadas para serem acionadas em determinados momentos quando a pontuação de um usuário sugerisse que poderia ser um bot. Por exemplo, comentários de blogs de usuários com pontuação baixa podiam ser enviados para uma fila de moderação quando clicavam em "enviar", ou usuários com pontuação baixa podiam ser solicitados a concluir um processo de autenticação de vários fatores quando tentavam fazer login em uma conta.

Métodos de autenticação baseados em IA, como o reCAPTCHA v3, procuram contornar o problema dos hackers. Ao remover desafios interativos do processo de verificação CAPTCHA, eles impedem que hackers usem dados de desafios resolvidos anteriormente para treinar bots para quebrar novos CAPTCHAs. Por causa disso, os especialistas acreditam que os CAPTCHAs baseados em IA podem se tornar a norma, substituindo completamente os CAPTCHAs baseados em desafios nos próximos cinco a dez anos.