Neste outono, o LinkedIn lançou seu primeiro agente de IA para recrutadores: Hiring Assistant. O novo produto, desenvolvido pela GPT da OpenAI, automatiza uma série de tarefas que normalmente consumiriam o tempo de um recrutador, como a elaboração de descrições de cargos, a busca de candidatos e a gestão de contatos. Utilizando o vasto conjunto de dados do usuário do LinkedIn, a ferramenta prioriza as habilidades em detrimento dos filtros tradicionais, que normalmente classificam os candidatos com base em fatores como localização ou núcleo material.
O Hiring Assistant é a mais recente adição ao vasto e variado campo da IA voltada para o recrutamento: existem ferramentas da Microsoft, Indeed, Google, IBM e muitas outras. E existe demanda para isso: uma pesquisa recente da IBM encontrou que as necessidades de recursos humanos e de aquisição de talentos representam 19% dos casos de uso que impulsionam a adoção da IA. Assim como muitos de seus concorrentes, o LinkedIn está ciente dos potenciais problemas de sua nova ferramenta e afirma que trabalhará para mitigá-los. Mas será que será suficiente?
"[O Assistente de RH] é uma ótima ideia, mas precisamos ter transparência e precisar saber quais habilidades ou palavras-chave na descrição do trabalho a ferramenta está inferindo", diz Hilke Schellmann, jornalista e autora de The Algorithm: Como IA decide quem é contratado, monitorado, promovido e demitido e por que precisamos lutar agora. “Temos visto muitos erros nesse tipo de tecnologia.”
À medida que o uso de ferramentas de recrutamento orientadas por IA cresce, os legislativos estaduais e municipais estão começando a perceber. A cidade de Nova York agora exige que as empresas divulguem o desempenho dos sistemas de contratação de IA e realizem auditorias de viés. Na Califórnia, uma nova lei protege contra a discriminação com base em identidades intersetoriais (embora não especifique IA). E o Departamento do Trabalho dos EUA criou um framework para ajudar os empregadores a promover a contratação inclusiva à medida que o uso dessas ferramentas aumenta.
Kyra Wilson, aluna de doutorado na Escola de Informação da Universidade de Washington, está interessada em investigar como as ferramentas de contratação de IA podem discriminar entre várias ocupações e grupos sociais. Recentemente, ela liderou um estudo que envolveu a análise de 554 currículos e 571 descrições de cargos, com nomes alterados para representar diferentes gêneros e raças. "Queríamos ver se essas ferramentas poderiam prejudicar injustamente certos candidatos", diz Wilson.
Os pesquisadores testaram três LLMs de código aberto do Salesforce, Context AI e Mistral AI. O que eles descobriram foi impressionante: apesar de controlar qualificações como experiência e educação, os modelos ainda favorecem desproporcionalmente candidatos com nomes associados a brancos em 85% das vezes, e aqueles com nomes associados a mulheres apenas 11% das vezes. E eles descobriram que os modelos não apenas replicaram vieses sociais existentes, mas também introduziram novos padrões.
"Os modelos que usamos não foram ajustados em nenhum conjunto de dados específico do domínio, então observamos que os vieses sociais gerais que favorecem pessoas brancas e do sexo masculino também começaram a ocorrer em posições que não são normalmente associadas a esses grupos", diz Wilson. "Usar esses modelos em escala poderia ter o potencial de alterar os padrões sociais de emprego de forma negativa."
Preconceitos ligados à interseccionalidade (neste caso, sobreposições entre raça e gênero) também surgiram nos resultados, particularmente para homens negros, que estavam em desvantagem em até 100% dos casos. "A interseccionalidade foi uma parte importante de nossa investigação porque é uma representação melhor de como as pessoas são discriminadas na vida real", disse Wilson. "As pessoas não percebem características como gênero e raça de forma isolada, e portanto estudá-las isoladamente não fornece necessariamente uma imagem completa dos verdadeiros impactos desses sistemas na sociedade."
Embora a pesquisa de Wilson investigue apenas identidades sinalizadas por nomes, ela observou que, no mundo real, as pessoas podem sinalizar suas identidades por meio de prêmios que receberam, lugares onde viveram e até mesmo as palavras que usam em seus currículos. Todos esses fatores podem desempenhar um papel na forma como a IA os avalia e, como muitos deles também são relevantes para distinguir candidatos fortes, não podem ser facilmente removidos durante a avaliação (da maneira como os nomes podem ser) sem que sejam eliminadas informações importantes .
"Saber mais sobre como esses fatores podem sinalizar identidades que se cruzam e se isso desempenha um papel na avaliação de IA é um próximo passo importante para pesquisadores e desenvolvedores de modelos", diz Wilson.
Afinal, os dados são a base sobre a qual esses modelos de IA são construídos. E, de acordo com o cientista sênior de pesquisa da IBM Moninder Singh, é onde a maioria dos vieses — implícitos ou explícitos, históricos ou sociais — são introduzidos. A maneira mais eficaz de atenuar o viés em ferramentas de IA de qualquer tipo é lidar com esses problemas logo no início do estágio de treinamento do LLM (e, se aplicável, durante o ajuste fino subsequente).
Singh explica que para a maioria das organizações que criam ferramentas baseadas em IA, como as usadas pelos recrutadores, lidar com os vieses nem sempre é viável no nível fundamental. Poucas empresas têm Recursos para treinar seus próprios LLMs, por isso normalmente dependem de modelos pré-treinados, como o GPT da OpenAI ou o PaLM do Google, e os ajustam para casos de uso específicos. No entanto, esse ajuste fino não pode ir tão longe, diz Singh. Na prática, a mitigação de viés geralmente ocorre no nível dos dados, com as empresas adaptando os LLMs aos seus conjuntos de dados específicos, que por sua vez são moldados pelos dados aos quais têm acesso.
"Apesar de empregar as melhores práticas e fazer o ajuste fino com quantidades potencialmente grandes de dados relevantes para a tarefa específica, como contratação, vieses ainda aparecerão quando os sistemas forem aplicados na vida real", diz Singh.
No nível de produção, Singh explica, as empresas podem implementar uma série de estratégias para detectar e mitigar vieses à medida que surgem em tempo real. Por exemplo, as ferramentas de contratação de IA podem gerar uma lista de candidatos pré-selecionados, e as empresas podem avaliar essas recomendações quanto à justiça, o que é exigido pela nova lei da cidade de Nova York. Se um viés for detectado, digamos, um grupo é consistentemente classificado mais baixo do que outros, os desenvolvedores podem ajustar o modelo refinando os dados de treinamento ou usando técnicas de pós-processamento para reponderar as recomendações.
Os métodos de pós-processamento também podem ser usados para ajustar pontuações ou classificações para torná-las mais justas sem afetar negativamente o desempenho geral do sistema, explica Singh. Ferramentas como o AI Fairness 360 da IBM, um pacote de código aberto para detecção e mitigação de vieses, fornece um conjunto de técnicas para fazer exatamente isso. A IBM também está trabalhando na detecção de vieses por meio de modelos como o Granite Guardian 3.0, que é ajustado para identificar riscos de viés no conteúdo gerado por IA.
Esses modelos podem ser usados para avaliar produções, como classificação de currículos, gerando explicações para decisões e verificando se indicadores de viés aparecem nessas explicações. Da mesma forma, a watsonx.governance toolkit da IBM possibilita a governança de modelos generativos, incluindo a detecção de viés, implementados na plataforma watsonx. E o benchmark SocialStigmaQA da IBM testa os modelos de aprendizagem baseados em lei (LLMs) em busca de vieses relacionados a estigmas que são frequentemente negligenciados em testes de viés tradicionais, mas que podem ser críticos em aplicações sensíveis como contratação, como aquelas relacionadas à saúde ou ao uso de drogas.
"Apesar dos melhores esforços do desenvolvedor de um sistema baseado em IA, como uma ferramenta de contratação, para eliminar o viés, é importante observar que ele não pode lidar com situações específicas de cada usuário final, especialmente se esse usuário final também não tenha cuidado suficiente para não ampliar ou introduzir vieses nesse nível", diz Singh. "Da mesma forma, o usuário final de uma ferramenta de contratação deve trazer diversidade em cada etapa."
