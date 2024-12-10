Este otoño, LinkedIn lanzó su primer agente de IA para responsables de selección de personal: Hiring Assistant. El nuevo producto, impulsado por GPT de OpenAI, automatiza una serie de tareas que normalmente consumirían mucho tiempo a los responsables de selección de personal, como la redacción de descripciones de puestos, la búsqueda de candidatos y la gestión de las comunicaciones. Utilizando el vasto tesoro de datos de usuarios de LinkedIn, la herramienta da prioridad a las habilidades frente a los filtros tradicionales, que suelen clasificar a los candidatos en función de factores como la ubicación o la universidad a la que asistieron.
Hiring Assistant es la última novedad en el amplio y variado campo de la IA diseñada para la selección de personal: existen herramientas de Microsoft, Indeed, Google, IBM y muchos otros. Y hay demanda: una encuesta reciente de IBM reveló que las necesidades de recursos humanos y adquisición de talento representan el 19 % de los casos de uso que impulsan la adopción de la IA. Al igual que muchos de sus homólogos, LinkedIn es consciente de los posibles sesgos de su nueva herramienta y afirma que trabajará para mitigarlos. Pero, ¿será suficiente?
“[HR Assistant] es una gran idea, pero necesitamos transparencia y saber en qué habilidades o palabras clave de la descripción del puesto se basa la herramienta”, afirma Hilke Schellmann, periodista y autora de The Algorithm: How AI Decides Who Gets Hired, Monitored, Promoted and Fired and Why We Need to Fight Back Now. “Hemos visto demasiados fallos en este tipo de tecnología”.
A medida que crece el uso de herramientas de selección de personal impulsadas por IA, las legislaturas estatales y municipales están empezando a tomar nota. La ciudad de Nueva York ahora exige a las empresas que revelen el rendimiento de los sistemas de contratación basados en IA y que realicen auditorías de sesgos. En California, una nueva ley protege contra la discriminación basada en identidades interseccionales (aunque no especifica la IA). Y el Departamento de Trabajo de los EE. UU. ha creado un marco para ayudar a los empleadores a promover la contratación inclusiva a medida que crece el uso de estas herramientas.
Kyra Wilson, estudiante de doctorado de la Facultad de Información de la Universidad de Washington, está interesada en investigar cómo las herramientas de contratación basadas en IA podrían discriminar entre diversas profesiones y grupos sociales. Recientemente, dirigió un estudio en el que se analizaron 554 currículos y 571 descripciones de puestos de trabajo, con nombres alterados para representar diferentes géneros y razas. “Queríamos ver si estas herramientas podían perjudicar injustamente a ciertos candidatos”, dice Wilson.
Los investigadores probaron tres LLM de código abierto de Salesforce, Contextual AI y Mistral AI. Lo que descubrieron fue sorprendente: a pesar de controlar cualificaciones como la experiencia y la educación, los modelos seguían favoreciendo de manera desproporcionada a los candidatos con nombres asociados a personas blancas en el 85 % de los casos, y a los que tenían nombres asociados a mujeres solo en el 11 % de los casos. Además, descubrieron que los modelos no solo replicaban los sesgos sociales existentes, sino que también introducían nuevos patrones.
“Los modelos que utilizamos no se ajustaron a ningún conjunto de datos específico de un dominio, por lo que observamos que los sesgos sociales generales que favorecen a las personas blancas y masculinas también comenzaron a darse en puestos que no suelen asociarse con estos grupos”, afirma Wilson. “El uso de estos modelos a escala podría tener el potencial de cambiar los patrones sociales de empleo de forma negativa”.
Los sesgos relacionados con la interseccionalidad (en este caso, la superposición entre raza y género) también surgieron en los resultados, especialmente en el caso de los hombres negros, que se vieron perjudicados en hasta el 100 % de los casos. “La interseccionalidad fue una parte importante de nuestra investigación porque representa mejor cómo se discrimina a las personas en la vida real”, afirma Wilson. “Las personas no perciben características como el género y la raza de forma aislada, por lo que estudiarlas de forma aislada no proporciona necesariamente una visión completa del verdadero impacto social de estos sistemas”.
Aunque la investigación de Wilson solo analizó las identidades que se indicaban mediante los nombres, señaló que, en el mundo real, las personas pueden indicar su identidad a través de los premios que han recibido, los lugares en los que han vivido e incluso las palabras que utilizan en sus currículos. Todos estos factores podrían influir en la forma en que la IA les evalúa y, dado que muchos de ellos también son relevantes para distinguir a los candidatos más sólidos, no pueden eliminarse fácilmente durante la revisión (como se puede hacer con los nombres) sin deshacerse de información importante.
“Aprender más sobre cómo estos factores pueden indicar identidades interseccionales y si eso influye en la evaluación de la IA es un paso importante para los investigadores y los desarrolladores de modelos”, afirma Wilson.
Al fin y al cabo, los datos son la base sobre la que se crean estos modelos de IA. Y, según Moninder Singh, investigador científico sénior de IBM, es ahí donde se introducen la mayoría de los sesgos, ya sean implícitos o explícitos, históricos o sociales. La forma más eficaz de mitigar los sesgos en cualquier tipo de herramienta de IA es abordar estas cuestiones en una fase temprana del entrenamiento del LLM (y, si procede, durante el ajuste fino posterior).
Singh explica que, para la mayoría de las organizaciones que crean herramientas basadas en IA, como las que utilizan los responsables de selección de personal, abordar los sesgos no siempre es factible a nivel básico. Pocas empresas disponen de los recursos necesarios para entrenar sus propios LLM, por lo que suelen recurrir a modelos preentrenados como el GPT de OpenAI o el PaLM de Google y los afinan para casos de uso específicos. Sin embargo, este ajuste fino solo puede llegar hasta cierto punto, afirma Singh. En la práctica, la mitigación de los sesgos suele producirse a nivel de datos, y las empresas adaptan los LLM a sus conjuntos de datos específicos, que a su vez están determinados por los datos a los que tienen acceso.
“A pesar de emplear buenas prácticas y realizar un ajuste fino con cantidades potencialmente enormes de datos relevantes para la tarea específica, como la contratación, los sesgos seguirán apareciendo cuando los sistemas se apliquen en la vida real”, afirma Singh.
A nivel de resultados, explica Singh, las empresas pueden implementar una serie de estrategias para detectar y mitigar los sesgos a medida que surgen en tiempo real. Por ejemplo, las herramientas de contratación basadas en IA pueden generar una lista de candidatos preseleccionados, y las empresas pueden evaluar esas recomendaciones en cuanto a su imparcialidad, tal y como exige la nueva ley de la ciudad de Nueva York. Si se detecta un sesgo, por ejemplo, que un grupo se clasifica sistemáticamente por debajo de otros, los desarrolladores pueden ajustar el modelo refinando los datos de entrenamiento o utilizando técnicas de posprocesamiento para volver a ponderar las recomendaciones.
Los métodos de posprocesamiento también pueden utilizarse para ajustar las puntuaciones o clasificaciones y hacerlas más justas sin afectar negativamente al rendimiento general del sistema, explica Singh. Herramientas como AI Fairness 360 de IBM, un kit de herramientas de código abierto para la detección y mitigación de sesgos, proporcionan un conjunto de técnicas para hacer precisamente eso. IBM también está trabajando en la detección de sesgos a través de modelos como Granite Guardian 3.0, que está optimizado para identificar riesgos de sesgo en el contenido generado por IA.
Estos modelos pueden utilizarse para evaluar resultados, como las clasificaciones de currículos, generando explicaciones para las decisiones y comprobando si aparecen indicadores de sesgo en esas explicaciones. Del mismo modo, el kit de herramientas watsonx.governance de IBM permite el gobierno de los modelos generativos, incluida la detección de sesgos, implementados en la plataforma watsonx. Y SocialStigmaQA de IBM utiliza pruebas de referencia para evaluar los LLM en busca de sesgos relacionados con estigmas que a menudo se pasan por alto en las pruebas de sesgo tradicionales, pero que pueden ser críticos en aplicaciones delicadas como la contratación, por ejemplo, las relacionadas con la salud mental o el consumo de drogas.
“A pesar de los esfuerzos del desarrollador de un sistema basado en IA, como una herramienta de contratación, por eliminar los sesgos, es importante señalar que no puede abordar situaciones específicas de cada usuario final, especialmente si ese usuario final tampoco tiene el cuidado suficiente para no magnificar o introducir sesgos a ese nivel”, afirma Singh. “El usuario final de una herramienta de contratación debe aportar diversidad de forma similar en cada paso”.
