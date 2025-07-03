Con el auge de la IA generativa y la búsqueda de IA impulsada por Anthropic, OpenAI, Meta y Perplexity, la web está viendo un nuevo tipo de visitante: los bot scrapers Este cambio afecta no solo a los editores de noticias, que dependen del tráfico de referencia para monetizar su periodismo, sino también a los creadores de contenidos y a las grandes plataformas tecnológicas. En un ejemplo, Reddit presentó recientemente una demanda contra Anthropic y afirma que sus bots están extrayendo su contenido, lo cual Anthropic niega.

"Las empresas tecnológicas también se ven afectadas por los rastreadores de IA", dijo Will Allen, director de control de IA, privacidad y productos multimedia de Cloudflare en una entrevista con IBM Think. "Pinterest, Quora y Reddit son algunos de los sitios tecnológicos de contenido generado por los usuarios más populares que se han sumado a nuestro enfoque basado en permisos para los rastreadores de IA, junto con empresas del sector de la IA como ProRata IA e Hyperscience".

Los bots se utilizan para el entrenamiento, pero también para la generación aumentada por recuperación (RAG), que conecta los modelos de IA generativa con bases de conocimiento externas, como el contenido disponible públicamente en Internet. Según un informe publicado el mes pasado por la empresa tecnológica TollBit, el tráfico de bots RAG observado en los sitios de sus socios creció un 49 %, casi 2,5 veces la tasa de tráfico de bots de entrenamiento del 18 %. De los 12 principales sitios web que rastrean los bots, TollBit descubrió que en el primer trimestre de 2025, ChatGPT, Meta y Perplexity fueron los más activos, representando un total de alrededor del 70 % de las extracciones promedio mensuales de los bots de IA.

Este nuevo tráfico afecta a los servidores y aumenta los costes de la infraestructura de los editores. En abril, Wikimedia, la organización sin fines de lucro detrás de Wikipedia, señaló que el 65 % de su tráfico más caro provenía de bots.. "Nuestro contenido es gratuito, nuestra infraestructura no lo es", dijo la organización en una entrada de blog.

Los bots hambrientos de datos también han afectado a las tasas de clics en la página de resultados de los motores de búsqueda, o SERP, que han sufrido un fuerte descenso en los últimos meses. Veamos las descripciones generales de la IA de Google: un estudio reciente de la empresa de marketing Ahrefs muestra que AI Overview, un producto lanzado por el gigante de las búsquedas para todos los usuarios en mayo pasado, redujo los clics en un 34,5 %. Aunque las vistas generales de la IA siguen creciendo (en un 116 % desde el pasado mes de marzo), los sitios que aparecen en los SERP se ven afectados.

"Lo que eso significa es que si estás ganando dinero a través de suscripciones, publicidad, [a través de] cualquiera de las cosas que hacen los creadores de contenido hoy en día, los visitantes no verán esos anuncios", dijo Prince de Cloudflare durante una reciente entrevista en CNBC. “Ya no van a comprar esas suscripciones. Y eso significa que será mucho, mucho más difícil para ti ser un creador de contenido”.