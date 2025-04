Um ditado comum no desenvolvimento da IA e ciência da computação é que um modelo de inteligência artificial (IA) é tão bom quanto os dados nos quais foi treinado. Nos últimos anos, pesquisadores descobriram que modelos generativos treinados exclusivamente com a saída de seus antecessores produzem resultados cada vez mais imprecisos. Esses modelos, assolados por "defeitos irreversíveis", acabam se tornando inúteis.1 Isso ocorre porque quaisquer erros presentes na saída de um modelo durante seu ajuste são posteriormente incluídos no treinamento de seu sucessor. Em seguida, o novo modelo também produz seus próprios erros. O colapso dos modelos progride à medida que os erros são agravados com gerações sucessivas.2

Esses erros ocorrem porque os modelos de IA generativa produzem conjuntos de dados com menos variação do que as distribuições de dados originais. Ilia Shumailov, Zakhar Shumaylov, Yiren Zhao e uma equipe de membros de universidades britânicas e canadenses escreveram um relatório amplamente citado sobre o colapso dos modelos. Por meio de experimentos em modelos de IA, a equipe descobriu que os modelos treinados em dados gerados por IA, também conhecidos como dados sintéticos, inicialmente perderam informações das caudas, ou extremos, da distribuição real dos dados — o que eles chamaram de “colapso inicial do modelo”. Em iterações dos modelos posteriores, a distribuição de dados convergiu tanto que não se parecia em quase nada com os dados originais — o que os pesquisadores chamaram de “colapso dos modelos tardios”.3

Em cenários do mundo real, o colapso dos modelos pode ocorrer devido aos processos de treinamento usados para grandes modelos de IA generativa, como grandes modelos de linguagem (LLMs ). Os LLMs são treinados principalmente em dados gerados por sres humanos extraídos da internet. No entanto, à medida que mais conteúdo gerado por IA se prolifera na web, mais ele pode ser usado para treinar modelos futuros em vez de dados gerados por humanos, podendo precipitar o colapso dos modelos.

O fenômeno do colapso dos modelos traz sérias ramificações para o desenvolvimento da IA, levando os pesquisadores a propor várias soluções. Essas soluções incluem rastrear a proveniência dos dados, preservar o acesso às fontes de dados originais e combinar dados acumulados gerados por IA com dados reais para treinar modelos de IA.