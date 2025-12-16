Os modelos de IA não apenas processam mais dados; eles também lidam com dados de maneira diferente dos sistemas legados. Se um software tradicional expõe acidentalmente informações sensíveis, um engenheiro pode acessar o código e fazer depuração. Mas os modelos de IA (incluindo modelos de linguagem de grande porte, como o ChatGPT) não são programados no sentido tradicional; eles são desenvolvidos para evoluir por meio de um processo chamado aprendizado de máquina. Nem mesmo seus criadores sabem exatamente como eles funcionam, o que torna a “depuração” algo complexo, quando não impossível.

Resultados acidentais são uma categoria de preocupação, mas as organizações também precisam estar atentas a ataques deliberados e maliciosos. Pesquisadores demonstraram que ferramentas de IA contêm novos tipos de vulnerabilidades que hackers habilidosos podem explorar, em um campo conhecido como aprendizado de máquina adversarial.

Nos últimos anos, por exemplo, especialistas em cibersegurança demonstraram que, ao explorar uma característica dos modelos de IA (o fato de suas respostas receberem pontuações de confiança mais altas quando lidam com dados nos quais foram treinados), um agente mal-intencionado pode inferir se determinados dados fizeram parte de um conjunto de treinamento. Em certos cenários, esse tipo de inferência configuraria uma grave violação de privacidade. Por exemplo, considere um modelo de IA conhecido por ter sido treinado com registros privados de saúde de pacientes soropositivos para HIV.

Em outro caso bem conhecido, pesquisadores foram além de simplesmente inferir se determinados dados faziam parte de um conjunto de treinamento. Eles criaram um ataque algorítmico capaz de fazer engenharia reversa dos dados reais que foram usados para treinar um modelo. Ao explorar um aspecto dos modelos de IA conhecido como seus “gradientes”, os pesquisadores conseguiram refinar iterativamente uma imagem repleta de ruído até obter uma imagem que se aproximava bastante de um rosto real que havia sido usado para treinar um modelo de reconhecimento facial.2

Os riscos em torno da proteção de dados continuam elevados: o relatório do custo das violações de dados de 2025 da IBM determinou que o custo médio dessas violações foi de USD 4,4 milhões. (Tais violações também acarretam um custo difícil de quantificar, na forma de danos à confiança do público na marca.)

Embora muitas dessas violações de dados não envolvam IA, um número crescente delas envolve. O relatório de índice de IA de 2025 de Stanford constatou que o número de incidentes de privacidade e segurança relacionados à IA aumentou 56,4% em um único ano, com 233 casos relatados em 2024.3