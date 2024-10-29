Os modelos de IA de caixa-preta surgem por uma de duas razões: ou seus desenvolvedores os transformam em caixas-pretas de propósito ou eles se tornam caixas-pretas como um subproduto de seu treinamento.

Alguns desenvolvedores e programadores de IA ocultam o funcionamento interno das ferramentas de IA antes de liberá-las para o público. Essa tática geralmente visa proteger a propriedade intelectual. Os criadores do sistema sabem exatamente como ele funciona, mas mantêm o código-fonte e o processo de tomada de decisão em segredo. Muitos algoritmos de IA tradicionais, baseados em regras, são caixas-pretas por esse motivo.

No entanto, muitas das tecnologias de IA mais avançadas, incluindo ferramentas de IA generativa, são o que se poderia chamar de "caixas-pretas orgânicas". Os criadores dessas ferramentas não ocultam intencionalmente suas operações. Em vez disso, os sistemas de deep learning que alimentam esses modelos são tão complexos que até mesmo os próprios criadores não entendem exatamente o que acontece dentro deles.

Os algoritmos de deep learning são um tipo de algoritmo de aprendizado de máquina que usa redes neurais. Enquanto um modelo tradicional de aprendizado de máquina pode usar uma rede com uma ou duas camadas, os modelos de deep learning podem ter centenas ou até milhares de camadas. Cada camada contém múltiplos neurônios, que são pacotes de código projetados para imitar as funções do cérebro humano.

As redes neurais podem consumir e analisar conjuntos de big data brutos e não estruturados com pouca intervenção humana. Elas podem receber grandes quantidades de dados, identificar padrões, aprender com esses padrões e usar o que aprenderam para gerar novas saídas, como imagens, vídeo e texto.

Essa capacidade de aprendizado em grande escala sem supervisão permite que os sistemas de IA realizem tarefas como processamento avançado de linguagem, criação de conteúdo original e outras proezas que podem parecer próximas à inteligência humana.

No entanto, essas redes neurais profundas são inerentemente opacas. Os usuários, incluindo os desenvolvedores de IA, podem ver o que acontece nas camadas de entrada e saída, também chamadas de "camadas visíveis". Eles podem ver os dados que entram e as previsões, classificações ou outros conteúdos que saem. Porém, eles não sabem o que acontece em todas as camadas de rede intermediárias, as chamadas "camadas ocultas".

Os desenvolvedores de IA sabem como os dados migram em cada camada da rede e têm uma noção geral do que os modelos fazem com os dados que ingrem. Mas eles não conhecem todos os detalhes. Por exemplo, eles podem não saber o que significa quando uma determinada combinação de neurônios é ativada, ou exatamente como o modelo encontra e combina embeddings de vetores para responder a um prompt.

Mesmo os modelos de IA de código aberto que compartilham seu código subjacente acabam sendo caixas-pretas, porque os usuários ainda não conseguem interpretar o que acontece em cada camada do modelo quando ele está ativo.