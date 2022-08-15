A veces, como científicos de datos, estamos tan decididos a construir un modelo perfecto que podemos incluir involuntariamente sesgos humanos en nuestros modelos. A menudo el sesgo se infiltra a través de los datos de entrenamiento y luego se amplifica e integra en el modelo. Si dicho modelo entra en un ciclo de producción, puede tener algunas implicaciones graves dirigidas por sesgos, como la predicción falsa de la puntuación crediticia o el examen de estado. En diversas industrias, los requisitos normativos para la equidad de los modelos y la IA confiable tienen como objetivo evitar que los modelos con sesgo ingresen en los ciclos de producción.

Para ser un científico de datos responsable, hay dos consideraciones clave al crear un pipeline de modelos:

Sesgo: un modelo que hace predicciones para personas de diferentes grupos (o raza, género, grupo étnico, etc.) las discrimina regularmente contra el resto Injusticia: un modelo que hace predicciones de manera que privan a las personas de su propiedad o libertad sin visibilidad

Detectar y definir el sesgo y la injusticia no es fácil. Para ayudar a los científicos de datos a reflexionar e identificar posibles preocupaciones éticas, el proceso estándar para la minería de datos debe incluir 3 pasos adicionales: evaluación de riesgos de datos, evaluación de riesgos de modelos y monitoreo de producción.