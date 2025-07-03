Con el auge de la IA generativa y la búsqueda de IA impulsada por Anthropic, OpenAI, Meta y Perplexity, la web está viendo un nuevo tipo de visitante: los raspadores de bots. Este cambio afecta no solo a los editores de noticias, que dependen del tráfico de referencia para monetizar su periodismo, sino también a los creadores de contenido y a las grandes plataformas tecnológicas. En un caso, Reddit presentó recientemente una demanda contra Anthropic y afirma que sus bots están extrayendo su contenido, lo cual Anthropic niega.

"Las empresas tecnológicas también se ven afectadas por los rastreadores de IA", dijo Will Allen, director de control de IA, privacidad y productos multimedia de Cloudflare en una entrevista con IBM Think. "Pinterest, Quora y Reddit son algunos de los sitios tecnológicos de contenido generado por los usuarios más populares que se han registrado en apoyo de nuestro enfoque basado en permisos para los rastreadores de IA, junto con empresas en el espacio de IA como ProRata IA e Hyperscience".

Los bots se utilizan para el entrenamiento, pero también para generación aumentada por recuperación (RAG, por sus siglas en inglés), que conecta los modelos de IA generativa a bases de conocimiento externas, como el contenido disponible públicamente en Internet. Según un informe publicado el mes pasado por la empresa de tecnología TollBit, el tráfico de bots de RAG observado en los sitios de sus socios creció un 49 %, casi 2.5 veces la tasa de tráfico de bots de entrenamiento del 18 %. De los 12 principales sitios web de rastreo de bots, TollBit descubrió que en el primer trimestre de 2025, ChatGPT, Meta y Perplexity fueron los más activos, representando un total de alrededor del 70 % de los raspados promedio mensuales de los bots de IA.

Este nuevo tráfico afecta a los servidores y genera crecientes costos en la infraestructura de los editores. En abril, Wikimedia, la organización sin ánimo de lucro detrás de Wikipedia, señaló que el 65% de su tráfico más caro provenía de bots. “Nuestro contenido es gratuito, nuestra infraestructura no”, dijo la organización en una entrada en el blog.

Los bots hambrientos de datos también han afectado las tasas de clics en la página de resultados del motor de búsqueda, o SERP, que han disminuido drásticamente en los últimos meses. Por ejemplo, AI Overviews de Google: un estudio reciente de la empresa de marketing Ahrefs muestra que AI Overview, un producto lanzado por el gigante de las búsquedas para todos los usuarios en mayo pasado, redujo los clics en un 34.5 %. Mientras que las descripciones generales de IA siguen creciendo (en 116% desde el pasado mes de marzo), los sitios que aparecen en la SERP se ven afectados.

"Eso significa que si ganas dinero a través de subscripciones, publicidad, [a través de] cualquiera de las cosas que los creadores de contenido están haciendo hoy en día, los visitantes no van a ver esos anuncios", dijo Prince de Cloudflare durante una reciente entrevista en CNBC. “Ya no van a comprar esas suscripciones. Y eso significa que va a ser mucho, mucho más difícil para ti ser un creador de contenido”.