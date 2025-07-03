Com o crescimento da IA generativa e da busca impulsionada por IA por empresas como Anthropic, OpenAI, Meta e Perplexity, a web está testemunhando um novo tipo de visitante: bots que coletam dados de forma automatizada. Essa mudança afeta não apenas as editoras de notícias, que dependem do tráfego de referência para monetizar seu jornalismo, mas também os criadores de conteúdo e as grandes plataformas de tecnologia. Em um caso específico, o Reddit entrou recentemente com um processo contra a Anthropic e alega que seus bots estão coletando seu conteúdo, o que a Anthropic nega..

"As empresas de tecnologia também são afetadas pelos rastreadores de IA", disse Will Allen, chefe de Controle de IA, Privacidade e Produtos de Mídia da Cloudflare, em entrevista à IBM Think. "Pinterest, Quora e Reddit são alguns dos sites de tecnologia de conteúdo gerado pelo usuário mais populares que aderiram à nossa abordagem baseada em permissão para rastreadores de IA, juntamente com empresas do setor de IA como ProRata IA e Hyperscience."

Os bots são usados para treinamento, mas também para geração aumentada de recuperação (RAG), que conecta modelos de IA generativa a bases de conhecimento externas, como conteúdos disponíveis publicamente na internet. De acordo com um relatório publicado no mês passado pela empresa de tecnologia TollBit, o tráfego de bot de RAG observado nos sites de seus parceiros cresceu 49%, quase 2,5 vezes a taxa de tráfego de bot de treinamento, que foi de 18%. Dos 12 principais sites de bots rastreadores, a TollBit descobriu que, no primeiro trimestre de 2025, ChatGPT, Meta e Perplexity foram os mais ativos, representando cerca de 70% da média mensal de rastreamentos realizados por bots de IA.

Esse novo tráfego sobrecarrega os servidores e aumenta os custos da infraestrutura dos editores. Em abril, a Wikimedia, organização sem fins lucrativos por trás da Wikipédia, observou que 65% do seu tráfego mais caro vinha de bots.. "Nosso conteúdo é gratuito, nossa infraestrutura não", disse a organização em uma postagem no blog.

Os bots ávidos por dados também afetaram as taxas de cliques na páginas de resultados dos mecanismos de busca (SERP), que sofreram uma queda acentuada nos últimos meses. Vejamos o AI Overviews do Google: um estudo recente da empresa de marketing Ahrefs mostra que o IA Overview, um produto lançado pela gigante das buscas para todos os usuários em maio passado, reduziu os cliques em 34,5%. Embora o IA Overviews continue crescendo – 116% desde março passado – os sites exibidos na SERP sofrem um impacto negativo.

"Isso significa que, se você está ganhando dinheiro com assinaturas, publicidade ou qualquer outra coisa que os criadores de conteúdo estão fazendo hoje, os visitantes não verão esses anúncios", disse Prince da Cloudflare durante uma recente entrevista à CNBC. "Eles não vão mais comprar essas assinaturas. E isso significa que vai ser muito, muito mais difícil para você ser um criador de conteúdo."