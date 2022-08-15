Sobald ein Modell von Data Scientists entwickelt wurde, wird es häufig an das MLOps-Team übergeben. Wenn die neuen Modelldaten in Produktion gehen, können sie eine neue Möglichkeit der Verzerrung mit sich bringen oder die Verzerrung verstärken, die zuvor ohne angemessene Überwachung übersehen wurde. Produktionsdaten können zu Abweichungen in der Leistung oder Konsistenz führen und Verzerrungen in das Modell und die Daten integrieren. Es ist sehr wichtig, Modelle zu überwachen, indem angemessene Warnmeldungen eingeführt werden, die auf eine Verschlechterung der Modellleistung hinweisen, und einen Mechanismus zur Entscheidung, wann ein Modell, das nicht mehr verwendet werden kann, mit einem Tool wie IBM Watson Studio ausgemustert werden muss. Auch hier sollte die Datenqualität verfolgt werden, indem die Produktionsdatenverteilung mit den zum Training des Modells verwendeten Daten verglichen wird.

Verantwortungsvolle Data Science bedeutet, über das Modell hinauszudenken, und zwar über Code und Leistung hinaus, und sie wird maßgeblich von den Daten beeinflusst, mit denen man arbeitet, und wie vertrauenswürdig diese sind. Letztlich ist die Abschwächung von Verzerrungen ein heikler, aber entscheidender Prozess, der dazu beiträgt, dass die Modelle den richtigen menschlichen Prozessen folgen. Das bedeutet nicht, dass man etwas Neues machen muss, aber es ist wichtig, das, was wir als Data Scientists bereits tun, neu zu überdenken und neu zu definieren, um sicherzustellen, dass es verantwortungsvoll gemacht wird.

