Por enquanto, uma das poucas coisas que impedem os agentes maliciosos de avançar são as proteções que os desenvolvedores implementam para proteger seus modelos de IA contra o uso indevido. O ChatGPT não gerará conscientemente um e-mail de phishing, e o Midjourney não criará imagens abusivas. No entanto, esses modelos pertencem a ecossistemas fechados, nos quais os desenvolvedores por trás deles têm o poder de determinar o que podem ou não ser usados.

Demorou apenas dois meses desde seu lançamento público para o ChatGPT alcançar 100 milhões de usuários. Desde então, inúmeros milhares de usuários tentaram violar suas proteções e "jailbreak" dele para fazer o que bem entendessem – com diferentes graus de sucesso.

A ascensão imparável dos modelos de código aberto tornará essas proteções obsoletas de qualquer forma. Embora o desempenho normalmente tenha ficado atrás dos modelos de código fechado, não há dúvida de que os modelos de código aberto melhorarão. O motivo é simples: os desenvolvedores podem usar os dados que quiserem para treiná-los. No lado positivo, isso pode promover a transparência e a concorrência e, ao mesmo tempo, apoiar a democratização da IA — em vez de deixá-la exclusivamente nas mãos de grandes corporações e reguladores.

Entretanto, sem salvaguardas, a IA generativa é a próxima fronteira do crime cibernético. IAs não autorizadas, como FraudGPT e WormGPT, estão amplamente disponíveis nos mercados da dark web. Ambas se baseiam no grande modelo de linguagem de código aberto (LLM) GPT-J desenvolvido pela EleutherAI em 2021.

Agentes maliciosos também estão usando sintetizadores de imagens de código aberto como o Stable Diffusion para construir modelos especializados capazes de gerar conteúdo abusivo. Os conteúdos de vídeo gerados por IA estão chegando. Atualmente, seus recursos são limitados apenas pela disponibilidade de modelos de código aberto de alto desempenho e pelo considerável poder de computação necessário para executá-los.