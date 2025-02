Proteger os dados



Durante a fase de coleta e manuseio de dados, você não apenas precisa coletar montes e montes de dados para alimentar um modelo de IA, mas também fornece acesso a muitas pessoas diferentes, incluindo cientistas de dados, engenheiros, desenvolvedores e outros. Há um risco inerente apresentado em centralizar todos esses dados em um só lugar e conceder acesso a eles a vários stakeholders, a maioria dos quais não tem experiência em segurança.

Basta considerar se a propriedade intelectual (IP) fundamental para a empresa está exposta devido ao manuseio incorreto dos dados de treinamento, podendo criar uma ameaça existencial à empresa. Aproveitar enormes quantidades de dados para um modelo de IA significa que as organizações precisam avaliar os variados riscos vinculados às informações de identificação pessoal (PII), questões de privacidade e outras informações confidenciais e, então, implementar os controles de segurança adequados em torno desses dados.

Proteções e defesas contra os ataques mais prováveis

O alvo principal na fase de coleta de dados são os conjuntos de dados subjacentes, sendo que a exfiltração de dados é considerada a técnica mais provável que os invasores tentarão empregar para obter informações valiosas e monetizáveis. Como os invasores buscam o caminho de menor resistência, os conjuntos de dados subjacentes são uma luz piscante que promete uma alta recompensa.

As organizações não devem ignorar a importância dos fundamentos da segurança — na verdade, eles devem ser priorizados. Se aplicados corretamente, esses fundamentos podem ter um impacto substancial na postura de segurança de uma organização. Isso inclui o foco na descoberta e classificação de dados, criptografia em repouso e em trânsito, e gerenciamento de chaves fornecido por plataformas de segurança de dados, como o IBM Security Guardium . Isso também significa focar nos fundamentos de gerenciamento de acesso e identidade impostos por soluções como o IBM Security Verify, que ajudam a garantir que nenhuma entidade única tenha acesso irrestrito ao modelo de IA. Por fim, as organizações devem aumentar a consciência sobre a segurança com os cientistas de dados e pesquisadores e garantir que as equipes de segurança trabalhem em estreita colaboração com essas equipes para garantir as proteções adequadas.

Proteger o modelo

No desenvolvimento de modelos, você está criando aplicações de uma nova maneira, e isso geralmente envolve a introdução de vulnerabilidades novas e exploráveis que os invasores podem usar como pontos de entrada no ambiente e, por sua vez, nos modelos de IA. Considerando que, historicamente, as organizações têm enfrentado dificuldades para gerenciar uma dívida crescente de vulnerabilidades conhecidas encontradas em seus ambientes, esse risco será transferido para a IA.

O desenvolvimento de aplicações de IA geralmente começa com equipes de ciência de dados reaproveitando modelos de aprendizado de máquina (ML) pré-treinados e de código aberto a partir de repositórios de modelos online, que geralmente carecem de controles de segurança abrangentes. No entanto, o valor que eles fornecem às organizações, como reduzir drasticamente o tempo e o esforço necessários para a adoção da IA generativa, frequentemente supera esse risco, transferindo-o para a empresa. A escassez geral de segurança em torno dos modelos de ML, juntamente com os dados cada vez mais confidenciais aos quais os modelos de ML estão expostos, significa que os ataques direcionados a esses modelos têm um alto potencial de danos.

Proteções e defesas contra os ataques mais prováveis

As principais técnicas de ataque durante o desenvolvimento de modelos são ataques à cadeia de suprimentos devido à grande dependência de modelos de ML pré-treinados e de código aberto de repositórios de modelos online usados para acelerar os esforços de desenvolvimento. Os invasores têm o mesmo acesso a esses repositórios online e podem implementar um backdoor ou malware neles. Uma vez carregados de volta no repositório, eles podem se tornar um ponto de entrada para qualquer um que baixe o modelo infectado. Se esses modelos estiverem infectados, pode ser incrivelmente difícil detectá-los. As organizações devem ser muito cautelosas sobre onde consomem modelos e o quanto a fonte é confiável.

Ataques à interface de programação de aplicativos (API) são outra preocupação. As organizações sem recursos ou conhecimento especializado para criar seus próprios grandes modelos de linguagem (LLMs) contam com APIs para consumir os recursos de modelos pré-treinados e pré-embalados. Os invasores reconhecem que esse será um modelo de consumo importante para os LLMs e procurarão atingir as interfaces das APIs para acessar e explorar os dados que estão sendo transportados nas APIs.

Os invasores também podem tentar explorar agentes ou plug-ins de LLMs com permissões excessivas para acessar funções abertas ou sistemas posteriores que podem executar ações privilegiadas em fluxos de trabalho de negócios. Se um invasor puder comprometer os privilégios concedidos aos agentes de IA, os danos poderão ser destrutivos.

O foco das organizações deve incluir:

Verificação contínua de vulnerabilidades, malware e corrupção em todo o pipeline de IA/ML

Descoberta e fortalecimento de integrações de APIs e plug-ins com modelos de terceiros

Configuração da imposição de políticas, controles e RBAC em torno de modelos, artefatos e conjuntos de dados de ML, para que nenhuma pessoa ou coisa tenha acesso a todos os dados ou a todas as funções dos modelos

Proteger o uso

Durante a inferência e o uso em tempo real, os invasores podem manipular prompts para quebrar barreiras de proteção e induzir modelos a se comportarem mal, gerando respostas não permitidas a prompts nocivos que incluem informações com viés, falsas e outras informações tóxicas. Isso pode causar danos à reputação da empresa. Os invasores também podem procurar manipular o modelo e analisar pares de entrada/saída para treinar um modelo substituto para imitar o comportamento do modelo-alvo, efetivamente “roubando” seus recursos e custando a uma empresa sua vantagem competitiva.

Proteções e defesas contra os ataques mais prováveis

Vários tipos de ataques são preocupantes nessa fase do pipeline de IA. Primeiro, injeções de prompts — onde os invasores usam prompts maliciosos para desbloquear modelos e obter acesso indevido, roubar dados confidenciais ou introduzir viés nas saídas. Outra preocupação envolve a denial-of-service do modelo, onde os atacantes sobrecarregam o LLM com entradas que degradam a qualidade do serviço e incorrem em altos custos de recursos. As organizações também devem se preparar e defender contra o roubo de modelos, onde os invasores criam entradas para coletar saídas dos modelos para treinar um modelo substituto que imita o comportamento do modelo-alvo.

Nossas melhores práticas incluem o monitoramento de entradas maliciosas, como injeções de prompts e saídas contendo dados confidenciais ou conteúdo impróprio, e a implementação de novas defesas que possam detectar e responder a ataques específicos de IA, como envenenamento de dados, evasão de modelos e extração de modelos. Novas soluções específicas de IA entraram no mercado com o nome de detecção e resposta de aprendizado de máquina (MLDR). Os alertas gerados por essas soluções podem ser integrados às soluções de operações de segurança, como o IBM Security QRadar, permitindo que as equipes do centro de operações de segurança (SOC) iniciem rapidamente playbooks que negam acesso, colocam em quarentena ou desconectam modelos comprometidos.

Proteger a infraestrutura

Uma das primeiras linhas de defesa é uma infraestrutura segura. As organizações devem aproveitar o conhecimento existente para otimizar os padrões de segurança, privacidade e conformidade em ambientes distribuídos que hospedam sistemas de IA. É essencial que elas fortaleçam a segurança da rede, o controle de acesso, a criptografia de dados e a detecção e prevenção de invasões em ambientes de IA. Elas também deveriam considerar investir em novas defesas de segurança especificamente projetadas para proteger a IA.

Estabelecer governança

A IBM oferece não apenas segurança para IA, mas também governança operacional para IA. A IBM está liderando o setor em governança de IA para alcançar modelos de IA confiável. À medida que as organizações transferem os processos operacionais de negócios para a IA, elas precisam garantir que o sistema de IA não esteja à deriva e esteja funcionando conforme o esperado. Isso torna os limites operacionais fundamentais para uma estratégia eficaz de IA. Um modelo que se desvia operacionalmente do que foi projetado para fazer pode introduzir o mesmo nível de risco que um adversário que comprometeu sua infraestrutura.