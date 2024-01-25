Todos queremos ver nossos valores humanos ideais refletidos em nossas tecnologias. Esperamos que tecnologias como a inteligência artificial (IA) não mintam para nós, não discriminem e sejam seguras para nós e nossos filhos usarmos. No entanto, muitos criadores de IA estão atualmente enfrentando reações adversas pelos vieses, imprecisões e práticas problemáticas de dados que estão sendo expostas em seus modelos. Esses problemas exigem mais do que uma solução técnica, algorítmica ou baseada em IA. Na realidade, é necessária uma abordagem holística e sociotécnica.
Todos os modelos preditivos, incluindo a IA, são mais exatos quando incorporam diversas inteligências e experiências humanas. Isto não é uma opinião; tem validade empírica. Considere o teorema da previsão da diversidade. Simplificando, quando a diversidade em um grupo é grande, o erro da multidão é pequeno, apoiando o conceito de "a sabedoria da multidão". Em um estudo influente, foi mostrado que grupos diversos de solucionadores de problemas de baixa capacidade podem superar grupos de solucionadores de problemas de alta capacidade (Hong & Page, 2004).
Em linguagem matemática: quanto maior sua variância, mais padrão será sua média. A equação tem a seguinte aparência:
Onde
c = a previsão média da multidão 🌽 =
o valor real
si = a previsão do indivíduo i
n = o número de indivíduos
Um estudo posterior forneceu mais cálculos que refinam as definições estatísticas de uma multidão sábia, incluindo a ignorância das previsões de outros membros e a inclusão daqueles com previsões ou julgamentos maximamente diferentes (negativamente correlacionados). Portanto, não é apenas o volume, mas a diversidade que melhora as previsões. Como esse insight pode afetar a avaliação de modelos de IA?
Para citar um aforismo comum, todos os modelos estão errados. Isso vale nas áreas de estatística, ciência e IA. Modelos criados com falta de experiência no domínio podem levar a saídas errôneas.
Hoje, um pequeno grupo homogêneo de pessoas determina quais dados usar para treinar modelos de IA generativa, que são extraídos de fontes com representação em demasia do inglês. "Para a maioria dos mais de 6.000 idiomas do mundo, os dados de texto disponíveis não são suficientes para treinar um modelo de base em grande escala" (de On the Opportunities and Risks of Foundation Models,” Bommasani et al., 2022).
Além disso, os próprios modelos são criados a partir de arquiteturas limitadas: "Quase todos os modelos de NLP de última geração agora são adaptados a partir de um dos poucos modelos de base, como BERT, RoBERTa, BART, T5 etc. Embora essa homogeneização produza uma alavancagem extremamente alta (quaisquer melhorias nos modelos de base podem levar a benefícios imediatos em todo o NLP), ela também representa uma desvantagem; todos os sistemas de IA podem herdar os mesmos vieses problemáticos de alguns modelos de base (Bommasani et al.)
Para que a IA generativa reflita melhor as diversas comunidades que atende, uma variedade muito maior de dados de seres humanos deve ser representada em modelos.
Avaliar a precisão do modelo anda de mãos dadas com a avaliação do viés. Devemos perguntar: qual é a intenção do modelo e para quem ele é otimizado? Considere, por exemplo, quem tem mais benefício dos algoritmos de recomendação de conteúdo e dos algoritmos dos mecanismos de busca. Os stakeholders podem ter interesses e objetivos muito diferentes. Algoritmos e modelos exigem alvos ou proxies para o erro de Bayes: o erro mínimo que um modelo deve melhorar. Esse proxy geralmente é uma pessoa, como um especialista no assunto com experiência no domínio.
As regulamentações e planos de ação emergentes da IA estão ressaltando cada vez mais a importância das formas de avaliação de impacto algorítmico. O objetivo destes formulários é capturar informações críticas sobre os modelos de IA para que as equipes de governança possam avaliar e lidar com os riscos antes de implementá-los. Perguntas típicas incluem:
Embora projetado com boas intenções, o problema é que a maioria dos proprietários de modelos de IA não entende como avaliar os riscos de seu caso de uso. Um refrão comum pode ser: "Como meu modelo pode ser injusto se não está coletando informações de identificação pessoal (PII)?" Consequentemente, os formulários raramente são preenchidos com a atenção necessária para que os sistemas de governança sinalizem com exatidão os fatores de risco.
Assim, a natureza sociotécnica da solução é destacada. O proprietário de um modelo — um indivíduo — não pode simplesmente receber uma lista de caixas de seleção para avaliar se seu caso de uso causará danos. Em vez disso, o que é necessário é que grupos de pessoas com experiências do mundo inteiro muito variadas se reúnam em comunidades que ofereçam segurança psicológica para ter conversas difíceis sobre impactos díspares.
A IBM acredita na adoção de uma abordagem de "cliente zero", implementando as recomendações e sistemas que faria para seus próprios clientes em consultoria e soluções orientadas por produtos. Essa abordagem se estende às práticas éticas, e é por isso que a IBM criou um Centro de Excelência em IA Confiável (COE).
Conforme explicado acima, a diversidade de experiências e conjuntos de habilidades é crítico para avaliar adequadamente os impactos da IA. Mas a perspectiva de participar de um centro de excelência pode ser intimidadora em uma empresa repleta de inovadores em IA, especialistas e engenheiros renomados, portanto, é necessário cultivar uma comunidade de segurança psicológica. A IBM comunica isso claramente dizendo: "Interessado em IA? Tem interesse na ética da IA? Você tem um lugar nesta mesa."
O COE oferece treinamento em ética de IA para profissionais de todos os níveis. São oferecidos programas de aprendizado síncrono (professor e alunos em ambientes de aula) e assíncrono (autoguiado).
Mas é o treinamento aplicado dos COEs que proporciona aos nossos profissionais os insights mais profundos, pois eles trabalham com equipes globais, diversas e multidisciplinares em projetos reais para entender melhor o impacto díspar. Eles também aproveitam frameworks de design thinking que o grupo de Design para IA da IBM usa internamente e com clientes para avaliar os efeitos não intencionais dos modelos de IA, mantendo aqueles que são frequentemente marginalizados em primeiro lugar. (Veja Wheel of Power and Privilege, de Sylyvia Duckworth, para obter exemplos de como características pessoais se cruzam para favorecer ou marginalizar pessoas.) A IBM também doou muitos dos frameworks para a comunidade de código aberto Design Ethically.
Abaixo estão alguns dos relatórios que a IBM publicou publicamente sobre esses projetos:
As ferramentas automáticas de governança de modelos de IA são necessárias para obter insights importantes sobre o desempenho do seu modelo de IA. Porém, é importante observar que capturar os riscos muito antes de o modelo ser desenvolvido e estar em produção é o ideal. Ao criar comunidades de profissionais diversos e multidisciplinares que ofereçam um espaço seguro para que as pessoas tenham conversas difíceis sobre impactos díspares, você pode iniciar sua jornada para operacionalizar seus princípios e desenvolver IA de forma responsável.
Na prática, quando você estiver contratando profissionais de IA, considere que mais de 70% do esforço na criação de modelos consiste em selecionar os dados certos. Você deseja contratar pessoas que saibam como coletar dados representativos e que também sejam coletados com consentimento. Você também quer que as pessoas que saibam trabalhar em estreita colaboração com especialistas de domínio para garantir que eles tenham a abordagem correta. É fundamental garantir que esses profissionais tenham a inteligência emocional para enfrentar o desafio de selecionar a IA de forma responsável com humanidade e discernimento. Devemos ser intencionais ao aprender a reconhecer como e quando os sistemas de IA podem exacerbar a desigualdade tanto quanto podem aumentar a inteligência humana.
