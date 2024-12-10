Afinal, os dados são a base sobre a qual esses modelos de IA são construídos. E, de acordo com o cientista sênior de pesquisa da IBM Moninder Singh, é onde a maioria dos vieses — implícitos ou explícitos, históricos ou sociais — são introduzidos. A maneira mais eficaz de atenuar o viés em ferramentas de IA de qualquer tipo é lidar com esses problemas logo no início do estágio de treinamento do LLM (e, se aplicável, durante o ajuste fino subsequente).

Singh explica que para a maioria das organizações que criam ferramentas baseadas em IA, como as usadas pelos recrutadores, lidar com os vieses nem sempre é viável no nível fundamental. Poucas empresas têm Recursos para treinar seus próprios LLMs, por isso normalmente dependem de modelos pré-treinados, como o GPT da OpenAI ou o PaLM do Google, e os ajustam para casos de uso específicos. No entanto, esse ajuste fino não pode ir tão longe, diz Singh. Na prática, a mitigação de viés geralmente ocorre no nível dos dados, com as empresas adaptando os LLMs aos seus conjuntos de dados específicos, que por sua vez são moldados pelos dados aos quais têm acesso.

"Apesar de empregar as melhores práticas e fazer o ajuste fino com quantidades potencialmente grandes de dados relevantes para a tarefa específica, como contratação, vieses ainda aparecerão quando os sistemas forem aplicados na vida real", diz Singh.

No nível de produção, Singh explica, as empresas podem implementar uma série de estratégias para detectar e mitigar vieses à medida que surgem em tempo real. Por exemplo, as ferramentas de contratação de IA podem gerar uma lista de candidatos pré-selecionados, e as empresas podem avaliar essas recomendações quanto à justiça, o que é exigido pela nova lei da cidade de Nova York. Se um viés for detectado, digamos, um grupo é consistentemente classificado mais baixo do que outros, os desenvolvedores podem ajustar o modelo refinando os dados de treinamento ou usando técnicas de pós-processamento para reponderar as recomendações.

Os métodos de pós-processamento também podem ser usados para ajustar pontuações ou classificações para torná-las mais justas sem afetar negativamente o desempenho geral do sistema, explica Singh. Ferramentas como o AI Fairness 360 da IBM, um pacote de código aberto para detecção e mitigação de vieses, fornece um conjunto de técnicas para fazer exatamente isso. A IBM também está trabalhando na detecção de vieses por meio de modelos como o Granite Guardian 3.0, que é ajustado para identificar riscos de viés no conteúdo gerado por IA.

Esses modelos podem ser usados para avaliar produções, como classificação de currículos, gerando explicações para decisões e verificando se indicadores de viés aparecem nessas explicações. Da mesma forma, a watsonx.governance toolkit da IBM possibilita a governança de modelos generativos, incluindo a detecção de viés, implementados na plataforma watsonx. E o benchmark SocialStigmaQA da IBM testa os modelos de aprendizagem baseados em lei (LLMs) em busca de vieses relacionados a estigmas que são frequentemente negligenciados em testes de viés tradicionais, mas que podem ser críticos em aplicações sensíveis como contratação, como aquelas relacionadas à saúde ou ao uso de drogas.

"Apesar dos melhores esforços do desenvolvedor de um sistema baseado em IA, como uma ferramenta de contratação, para eliminar o viés, é importante observar que ele não pode lidar com situações específicas de cada usuário final, especialmente se esse usuário final também não tenha cuidado suficiente para não ampliar ou introduzir vieses nesse nível", diz Singh. "Da mesma forma, o usuário final de uma ferramenta de contratação deve trazer diversidade em cada etapa."