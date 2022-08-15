作为数据科学家，有时我们过于执着于构建完美的模型，以至于无意中将人为偏倚引入到模型中。这种偏倚通常会通过训练数据潜入，然后被放大并嵌入到模型中。如果这种模型进入了生产周期，可能会因偏倚产生一些严重后果，例如信用评分或运行状况检查结果出现预测错误。在各个行业中，针对模型公平性和值得信赖的 AI 的监管要求旨在防止有偏倚的模型进入生产周期。
要成为负责任的数据科学家，在构建模型管道时有两个关键考虑因素：
检测和定义偏倚和不公平现象并非易事。为了帮助数据科学家反思和识别可能的伦理问题，数据挖掘的标准流程应额外增加三个步骤：数据风险评估、模型风险评估和生产监控。
数据科学家可以在这一步中评估不同人群的目标变量之间是否存在不平衡情况。例如，我们仍然可以看到管理岗位录用男性的概率高于女性。但我们都知道，根据性别来招聘员工是违法的，因此，为了平衡模型，您可以争辩说性别不应成为考量因素，甚至可以将其剔除。但是，剔除性别这个因素还能带来什么其他影响呢？在采取这一步骤之前，应请相关专家进行审查，以确定当前的检查是否足以消除模型中的潜在偏移。
平衡数据的目的是模仿生产中使用的数据分布，这是为了确保训练数据尽可能接近生产环境中实时使用的数据。因此，虽然最初的反应是去掉有偏倚变量，但这种方法不太可能解决问题。变量之间常常存在相关性，偏倚可能通过其中一个相关字段潜入，以代理替代的形式存在于模型中。因此，在消除偏倚之前，应筛选所有相关性，以确保真正消除偏倚。
模型预测具有直接而严重的影响，实际上甚至能够彻底改变一个人的生活。如果一个模型预测你的信用评分较低，这可能会影响你生活中的方方面面，因为你在申请信用卡和贷款、寻找住房和申请合理利率时会遇到困难。另外，如果您不知道低分背后的原因，就没有改进的机会。
数据科学家的工作是确保模型为所有人提供最公平的结果。如果数据有偏倚，模型就会从这种偏倚中学习，从而做出不公平的预测。黑匣模型能提供很好的结果，但缺乏可解释性和可说明性，因此无法检查是否存在危险信号，从而无法确保公平性。因此，深入研究模型结果十分必要。数据科学家需要在可解释性与模型性能之间进行权衡评估，选出最能满足这两种需求的模型。
数据科学家开发出模型后，通常会将其移交给 MLOps 团队。当新的模型数据投入生产后，可能会带来新的偏倚，或者加剧以前由于缺乏适当监控而被忽视的偏倚。生产数据可能会导致性能或一致性出现偏差，并将偏倚带入模型和数据中。监控模型非常重要，可以引入指示模型性能下降的适当警报，并建立一种机制来决定何时停用不再适合使用的模型，比如使用 IBM Watson Studio 等工具。同样，应将生产数据的分布与用于训练模型的数据进行比较，以此来跟踪数据质量。
负责任的数据科学不仅仅关注模型的代码和性能，更要关注数据本身的质量和可靠性。归根结底，减轻偏倚是一个微妙但至关重要的过程，有助于确保模型遵循正确的人类操作流程。这并不意味着你需要做什么新的事情，重要的是要重新思考并重新定义我们作为数据科学家目前的工作，确保这些工作以负责任的方式进行。
