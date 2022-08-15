作为数据科学家，有时我们过于执着于构建完美的模型，以至于无意中将人为偏倚引入到模型中。这种偏倚通常会通过训练数据潜入，然后被放大并嵌入到模型中。如果这种模型进入了生产周期，可能会因偏倚产生一些严重后果，例如信用评分或运行状况检查结果出现预测错误。在各个行业中，针对模型公平性和值得信赖的 AI 的监管要求旨在防止有偏倚的模型进入生产周期。

要成为负责任的数据科学家，在构建模型管道时有两个关键考虑因素：

偏倚：一个对不同群体（或种族、性别、民族群体等）进行预测的模型，经常会对他们区别对待 不公平：在不可见的情况下以剥夺他人财产或自由的方式进行预测的模型

检测和定义偏倚和不公平现象并非易事。为了帮助数据科学家反思和识别可能的伦理问题，数据挖掘的标准流程应额外增加三个步骤：数据风险评估、模型风险评估和生产监控。