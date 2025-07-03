Con l'ascesa dell'AI generativa e della ricerca AI alimentata da Anthropic, OpenAI, Meta e Perplexity, il web sta assistendo a un nuovo tipo di visitatore: i bot di scraping. Questo cambiamento non riguarda solo gli editori di notizie, che fanno affidamento sul traffico di riferimento per monetizzare il loro giornalismo, ma anche i creatori di contenuti e le grandi piattaforme tecnologiche. In un caso, Reddit ha recentemente intentato una causa contro Anthropic e sostiene che i suoi bot stiano facendo scraping sui suoi contenuti, cosa che Anthropic nega.

"Anche le aziende tecnologiche sono colpite dai crawler AI", ha affermato Will Allen, Head of AI Control, Privacy and Media Products presso Cloudflare in un'intervista con IBM Think. "Pinterest, Quora e Reddit sono alcuni dei più popolari siti tecnologici di contenuti generati dagli utenti che hanno aderito a sostegno del nostro approccio basato sul permesso ai crawler AI, insieme ad aziende del settore AI come ProRata AI e Hyperscience".

I bot sono utilizzati per l'addestramento, ma anche per la retrieval-augmented generation (RAG), che collega modelli di AI generativa a basi di conoscenza esterne, come contenuti pubblici su Internet. Secondo un report pubblicato il mese scorso dalla società tecnologica TollBit, il traffico dei bot RAG osservato sui siti dei loro partner è cresciuto del 49%, quasi 2,5 volte il tasso del traffico dei bot di addestramento pari al 18%. Tra i primi 12 bot che scansionano siti web, TollBit ha rilevato che nel primo trimestre del 2025 ChatGPT, Meta e Perplexity sono stati i più attivi, rappresentando in totale circa il 70% delle medie mensili di scraping da parte dei bot AI.

Questo nuovo traffico pesa sui server e genera costi crescenti sull'infrastruttura degli editori. Ad aprile, Wikimedia, l'organizzazione no-profit dietro Wikipedia, ha osservato che il 65% del suo traffico più costoso proveniva da bot. "I nostri contenuti sono gratuiti, la nostra infrastruttura no", ha dichiarato l'organizzazione in un post sul blog.

I bot affamati di dati hanno anche influenzato i tassi di click sulla pagina dei risultati dei motori di ricerca, o SERP, che negli ultimi mesi sono diminuiti bruscamente. Prendiamo AI Overview di Google: uno studio recente della società di marketing Ahrefs mostra che AI Overview, un prodotto lanciato dal colosso della ricerca a tutti gli utenti lo scorso maggio, ha ridotto i clic del 34,5%. Mentre gli AI Overview continuano a crescere del 116% rispetto a marzo scorso, i siti disponibili sul SERP subiscono un duro colpo.

"Ciò significa che se guadagni con abbonamenti, pubblicità, [attraverso] qualsiasi cosa che i creatori di contenuti fanno oggi, i visitatori non vedranno quegli annunci", ha detto Prince di Cloudflare durante una recente intervista alla CNBC. "Non acquisteranno più quegli abbonamenti e questo significa che sarà molto, molto più difficile essere un creatore di contenuti."