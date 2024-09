Le prime forme di tecnologia CAPTCHA sono state sviluppate da vari gruppi diversi in parallelo tra la fine degli anni '90 e l'inizio degli anni 2000. Ciascun gruppo stava lavorando per contrastare il diffuso problema degli hacker che utilizzavano i bot per svolgere attività illecite su internet. Ad esempio, gli scienziati informatici che lavoravano per il motore di ricerca AltaVista volevano impedire ai bot di aggiungere indirizzi web dannosi al database dei collegamenti dell'azienda.

I ricercatori dell'azienda IT Sanctum presentarono una richiesta di brevetto per il primo sistema in stile CAPTCHA nel 1997. Ma il termine CAPTCHA fu coniato nel 2003 da un gruppo di ricercatori di computer science presso la Carnegie Mellon University guidato da Luis von Ahn e Manuel Blum. Questo team fu ispirato a lavorare sulla tecnologia da un dirigente di Yahoo che aveva tenuto un discorso sui problemi dell'azienda con gli spambot che registravano milioni di falsi account e-mail.

Per risolvere il problema di Yahoo, von Ahn e Blum crearono un programma del computer che 1) generava una stringa di testo casuale, 2) generava un'immagine distorta di quel testo (detto 'codice CAPTCHA'), 3) presentava l'immagine all'utente, e 4) chiedeva all'utente di immettere il testo in un campo del modulo e di inoltrare quindi l'immissione facendo clic su una casella di spunta accanto alla frase 'I am not a robot' (Non sono un robot). Poiché la tecnologia di riconoscimento ottico dei caratteri (OCR) dell'epoca aveva difficoltà a decifrare un testo così distorto, i bot non riuscivano a superare il test CAPTCHA. Se un utente immetteva la stringa di caratteri corretta, si poteva presumere in modo attendibile che fossero degli esseri umani e veniva loro consentito di completare la registrazione di un account o l'invio di un modulo web.

Yahoo implementò la tecnologia della Carnegie Mellon, richiedendo a tutti gli utenti di superare un test CAPTCHA prima di registrare un indirizzo e-mail. Ciò ridusse drasticamente l'attività degli spambot e altre aziende procedettero all'adozione dei CAPTCHA per proteggere i loro moduli web. Nel tempo, tuttavia, gli hacker hanno utilizzato i dati dai test CAPTCHA completati per sviluppare algoritmi in grado di superare tali test in modo affidabile. Questo ha segnato l'inizio di una corsa agli armamenti che continua tuttora tra sviluppatori di CAPTCHA e criminali informatici che è stata alimentata dall'evoluzione della funzionalità CAPTCHA.

reCAPTCHA v1

Lanciato da von Ahn nel 2007, reCAPTCHA v1 aveva un duplice intento: rendere i test CAPTCHA basati sui test più difficili da superare per i bot e migliorare l'accuratezza del riconoscimento ottico dei caratteri (OCR) utilizzato all'epoca per digitalizzare i testi stampati.

reCAPTCHA raggiunse il primo obiettivo aumentando la distorsione del testo presentato all'utente ed eventualmente aggiungendo delle linee che correvano lungo il testo.

Raggiunse il secondo obiettivo sostituendo una singola immagine di testo distorto generato casualmente con due immagini di testo distorto di parole scansionate da testi reali da due diversi programmi OCR. La prima parola, o parola di controllo, era una parola che veniva identificata correttamente da entrambi i programmi OCR; la seconda parola era una parola che entrambi i programmi OCR non erano in grado di identificare. Se l'utente identificava correttamente la parola di controllo, reCAPTCHA 1) presumeva che l'utente fosse un essere umano e gli consentiva di continuare l'attività che stava svolgendo, e 2) presumeva anche che l'utente stesse identificando correttamente la seconda parola e utilizzava la risposta per verificare i futuri risultati di OCR.

In questo modo, reCAPTCHA migliorò la sicurezza anti-bot e migliorò l'accuratezza dei testi digitalizzati presso l'Internet Archive e il New York Times. (Paradossalmente, col tempo contribuì anche a migliorare gli algoritmi di AI e machine learning al punto che, entro il 2014, erano in grado di identificare i CAPTCHA di testo distorto il 99,8% delle volte).

Nel 2009, Google acquistò reCAPTCHA e iniziò a utilizzarlo per digitalizzare i testi per Google Books offrendolo al contempo come un servizio ad altre organizzazioni. Tuttavia, man mano che la tecnologia OCR progrediva con l'aiuto di reCAPTCHA, lo stesso succedeva per i programmi di AI che potevano risolvere efficacemente i reCAPTCHA basati sul testo. Di tutta risposta, Google introdusse nel 2012 i reCAPTCHA di riconoscimento delle immagini, che sostituirono il testo distorto con immagini prese da Google Street View. Gli utenti dimostravano che erano esseri umani identificando oggetti del mondo reale come semafori e taxi. Oltre ad aggirare l'OCR avanzato ora messo in campo dai bot, questi reCAPTCHA basati sulle immagini erano considerati più pratici per gli utenti di app su dispositivi mobili.

Google ReCAPTCHA v2: No CAPTCHA reCAPTCHA

Nel 2014, Google ha rilasciato reCAPTCHA v2, che ha sostituito i test basati su testo e immagini con una semplice casella di spunta che indica "Non sono un robot". Quando gli utenti selezionano la casella di spunta, reCAPTCHA v2 analizza le sue interazioni con le pagine web, valutando fattori quali la velocità di digitazione, i cookie, la cronologia del dispositivo e l'indirizzo IP per determinare se è probabile che un utente sia un essere umano. Anche la casella di spunta fa parte della modalità di funzionamento del CAPTCHA: no CAPTCHA reCAPTCHA tiene traccia dei movimenti del mouse dell'utente quando fanno clic sulla casella. I movimenti di un essere umano tendono ad essere più caotici, mentre i movimenti dei robot sono più precisi. Se no CAPTCHA reCAPTCHA sospetta che un utente possa essere un bot, gli presenta un test CAPTCHA basato su un'immagine.

ReCAPTCHA v3

reCAPTCHA v3, presentato nel 2018, fa a meno della casella di spunta e amplia l'analisi del rischio basata sull'AI di no CAPTCHA reCAPTCHA. ReCAPTCHA v3 si integra con una pagina web tramite API JavaScript ed è in esecuzione in background, assegnando un punteggio al comportamento di un utente su una scala che va da 0,0 (probabilmente un bot) a 1,0 (probabilmente un essere umano). I proprietari dei siti web possono impostare delle azioni automatizzate da attivare in specifici momenti quando il punteggio di un utente suggerisce che potrebbe essere un bot. Ad esempio, i commenti nei blog da utenti con un punteggio basso possono essere inviati a una coda di moderazione quando fanno clic su "invia" oppure può essere chiesto loro di completare un processo di autenticazione a più fattori quando tentano di eseguire l'accesso in un account.

Rimuovendo i test interattivi dal processo di verifica CAPTCHA, i metodi di autenticazione basati sull'AI come reCAPTCHA v3 cercano di aggirare il problema degli hacker che utilizzano test risolti in precedenza per addestrare i bot a superare i nuovi CAPTCHA. Per questo motivo, gli esperti ritengono che i CAPTCHA basati sull'AI potrebbero diventare la norma, sostituendo completamente i CAPTCHA basati sui test nei prossimi 5-10 anni.