A veces, como científicos de datos, estamos tan decididos a construir un modelo perfecto que podemos incluir involuntariamente sesgos humanos en nuestros modelos. A menudo el sesgo se infiltra a través de los datos de entrenamiento y luego se amplifica e integra en el modelo. Si dicho modelo entra en un ciclo de producción, puede tener algunas implicaciones graves dirigidas por sesgos como la predicción falsa de la puntuación crediticia o el examen de salud. En varios sectores, los requisitos reglamentarios de equidad de los modelos y una IA fiable tienen como objetivo evitar que modelos sesgados entren en los ciclos de producción.

Para ser un científico de datos responsable, hay dos consideraciones clave a la hora de crear una canalización de modelos:

Sesgo: un modelo que hace predicciones para personas de diferentes grupos (o raza, género, grupo étnico, etc.) las discrimina regularmente contra el resto Inequidad: un modelo que hace predicciones de manera que priva a las personas de su propiedad o libertad sin visibilidad

Detectar y definir el sesgo y la injusticia no es fácil. Para ayudar a los científicos de datos a reflexionar e identificar posibles preocupaciones éticas, el proceso estándar de minería de datos debería incluir tres pasos adicionales: evaluación del riesgo de datos, evaluación de riesgos de modelos y monitorización de la producción.