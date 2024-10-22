As organizações têm um novo pipeline de projetos sendo construídos que aproveitam a IA generativa. Durante a fase de coleta e manuseio de dados, você precisa coletar grandes volumes de dados para alimentar o modelo e está fornecendo acesso a várias pessoas diferentes, incluindo cientistas de dados, engenheiros, desenvolvedores e outros. Isso apresenta de forma inerente um risco ao centralizar todos esses dados em um só lugar e dar acesso a eles a muitas pessoas. Isso significa que a IA generativa é um novo tipo de armazenamento de dados que pode criar novos dados com base em dados organizacionais existentes. Seja você treinando o modelo, ajustando-o ou conectando-o a um RAG (Vector DB), esses dados provavelmente contêm PII, preocupações de privacidade e outras informações confidenciais. Esse monte de dados confidenciais é um alvo vermelho intermitente que ao qual os invasores tentarão obter acesso.

Dentro do desenvolvimento do modelo, novas aplicações estão sendo criadas de maneira totalmente nova, com novas vulnerabilidades que se tornam novos pontos de entrada que os invasores tentarão fazer exploração. O desenvolvimento geralmente começa com as equipes de ciência de dados baixando e reutilizando modelos de aprendizado de máquina de código aberto pré-treinados de repositórios de modelos online, como o HuggingFace. ou TensorFlow Hub. Os repositórios de compartilhamento de modelos de código aberto nasceram da complexidade inerente à ciência de dados, da escassez de profissionais e do valor que eles agregam às organizações, reduzindo drasticamente o tempo e o esforço necessários para a adoção da IA generativa. No entanto, esses repositórios podem não ter controles de segurança abrangentes, o que acaba transferindo o risco para a empresa — e os invasores contam com isso. Eles podem injetar uma backdoor ou malware em um desses modelos e carregar o modelo infectado de volta para os repositórios de compartilhamento de modelos, afetando qualquer pessoa que o baixe. A escassez geral de segurança em torno dos modelos de ML, aliada aos dados cada vez mais confidenciais aos quais esses modelos estão expostos, significa que os ataques direcionados a esses modelos têm alta propensão para causar danos.

E durante a inferência e o uso em tempo real, os invasores podem manipular prompts para desbloquear proteções e persuadir modelos a se comportarem mal, gerando respostas não permitidas a prompts com viés, incluindo informações com viés, falsas e outras informações tóxicas, causando danos à reputação. Ou os invasores podem manipular o modelo e analisar pares de entrada-saída para treinar um modelo substituto para imitar o comportamento do modelo-alvo, efetivamente "roubando" seus recursos, custando à empresa sua vantagem competitiva.