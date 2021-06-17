Der Fokus der Branche auf vertrauenswürdige KI wird von mehreren Faktoren angetrieben – der Haltung der Unternehmen zur sozialen Verantwortung, Bedenken in Bezug auf Reputationsrisiken und einer wachsenden Zahl von Vorschriften. Unternehmen erkennen, dass sie einen systematischen Ansatz benötigen, um sicherzustellen, dass KI und maschinelles Lernen vertrauenswürdig sind und operationalisiert werden können. Zu den Aspekten einer vertrauenswürdigen KI gehören Fairness, Robustheit, Datenschutz, Erklärbarkeit und Transparenz. Zu den Anwendungsfallmustern gehören die Durchführung von Zustandsprüfungen bestehender Anwendungen und die Erstellung eines unternehmensweiten Frameworks für die KI-Governance. Heute konzentrieren wir uns jedoch auf die Operationalisierung neuer Anwendungen.
Unternehmen benötigen einen systematischen Ansatz, um neue KI-Anwendungen auf vertrauenswürdige Weise zu entwickeln und in Betrieb zu nehmen. Dieser Ansatz muss den gesamten Lebenszyklus von Data Science und KI berücksichtigen. Der KI-Lebenszyklus besteht aus einer Abfolge von Phasen, die verschiedene Personas und Best Practices zusammenbringen. (Siehe den O'Reilly-Bericht Operationalizing AI für einen allgemeinen Einblick.) Zu den Phasen des Lebenszyklus gehören:
Im Idealfall sollten Aspekte vertrauenswürdiger KI in jeder dieser Phasen berücksichtigt werden und nicht erst am Ende. Wir brauchen in jeder Phase angemessene Leitplanken, von der Geschäftsdefinition, Datenexploration und Modellentwicklung bis hin zur Modellvalidierung, Bereitstellung, Überwachung und fortlaufendem Management. Lassen Sie uns einen genaueren Blick auf die einzelnen Phasen werfen und darauf, wie verschiedene Aspekte vertrauenswürdiger KI angegangen werden.
Diese Phase leitet die Priorisierung von Anwendungsfällen und die Entwicklung eines KI-Aktionsplans. Das Team – bestehend aus einem Business-Stakeholder, einem Data Scientist, einem Data Owner, einem Operations Lead und weiteren Rollen – konzentriert sich zunächst auf den Business-Anwendungsfall, definiert den Geschäftswert und legt die Business-KPIs fest. Anschließend wird die technische Aufgabe angegangen, indem das Geschäftsziel in spezifische KI-Aufgaben übersetzt wird. Abschließend entwickelt das Team einen strukturierten Aktionsplan für eine Lösung der identifizierten technischen Aufgaben zur Unterstützung des Geschäftsziels.
Die Anwendung der Prinzipien von Enterprise Design Thinking ist eine Best Practice für diese Phase. Design Thinking hilft, verschiedene geschäftliche und technische Aspekte von Verzerrung/Fairness, Robustheit, Erklärbarkeit usw. im Kontext des Anwendungsfall zu identifizieren und zu definieren. Diese Phase hilft bei der Beantwortung von Fragen wie:
Es ist auch wichtig, alle Unternehmensdaten und KI-Richtlinien zur Kenntnis zu nehmen, die das Team bei der Ausarbeitung dieser Anwendungsfälle befolgen muss, um zu vermeiden, dass es in letzter Minute zu Problemen bei der Validierung für den Einsatz in der Produktion kommt.
In dieser Phase kann der Datennutzer relevante Datensätze finden und darauf zugreifen. Data-Science-Teams können in einem zentralen Katalog „nach Daten suchen“, indem sie entweder Metadaten oder Geschäftsbegriffe zur Suche verwenden. Sie können die Daten verstehen, einschließlich ihres Eigentümers, ihrer Herkunft, ihrer Beziehung zu anderen Datensätzen usw. Es ist wichtig, Datenwissenschaftlern einen technischen Überblick über die Datenherkunft zu geben, damit sie jede Datentransformation verstehen können, die sich auf die Erstellung und Verwendung von Funktionen auswirken könnte.
Auf Grundlage dieser Analyse können sie einen Datenfeed anfordern. Nach der Genehmigung können die Datensätze dem Data-Science-Team in dessen Data-Science-Entwicklungsumgebung zur Verfügung gestellt werden.
Wenn das Team mit regulierten personenbezogenen Daten wie personenbezogenen Daten (PII) oder geschützten Gesundheitsinformationen (PHI) arbeiten muss, muss der Datenverantwortliche oder ein Datenanbieter sicherstellen, dass die geteilten Daten durch angemessene Anonymisierung den Vorschriften entsprechen.
In dieser Phase erkunden und bereiten die Data-Science-Teams die Daten auf und entwickeln, trainieren und testen ihre KI/ML-Modelle. Die Aktivitäten in dieser Phase lassen sich am besten als eine Reihe flexibler Sprints durchführen. Es ist wichtig, dass die Verzerrungen in den Daten in diesem Stadium überprüft werden, noch bevor mit der Modellbildung begonnen wird. Dies ist eine innere Leitplanke zur Gewährleistung der Fairness, und solche Leitplanken können während und nach den Modellbauphasen angebracht werden. Die Robustheit des Modells, die Erklärbarkeit und andere Aspekte können in dieser Phase ebenfalls berücksichtigt und getestet werden.
Sobald diese Tests erfolgreich abgeschlossen sind, ermöglicht eine MLOps-Pipeline die Übertragung des Modells und der zugehörigen Assets von der Entwicklungsumgebung in eine Vorproduktions-Validierungsumgebung.
Diese Phase beinhaltet die Validierung des Modells und die Bereitstellung in die Produktion. Die Validierungsaktivitäten können von einem anderen Team als dem, das das Modell erstellt hat, durchgeführt werden, beispielsweise vom Modellvalidierungs- oder Modellrisikomanagementteam des Unternehmens oder von einer externen Stelle.
Dieses Team validiert Qualität, Robustheit, Fairness usw. und erstellt Validierungsberichte. Es ist wichtig, die Ergebnisse der Validierung zur Referenz und zum Vergleich zu erfassen. Modellfaktenblätter, lokale und globale Erklärungen sowie weitere Kennzahlen werden ebenfalls überprüft.
Wenn das Modell die Validierung besteht, kann das Ops-Team es mithilfe einer MLOps-Pipeline in die Produktionsumgebung übertragen. Das Modell wird dort entweder für den Online- oder Batch-Aufruf bereitgestellt.
In dieser Phase richtet das Ops-Team die kontinuierliche Überwachung und Verwaltung des KI/ML-Modells im Produktivbetrieb ein. Das Team konfiguriert Monitore für die regelmäßige, geplante Erfassung von Metriken. Qualität, Robustheit und Fairness werden in einer von den Geschäftsanforderungen abhängigen Häufigkeit überwacht. Die Überwachung von Daten- und Genauigkeitsabweichungen sowie die Erstellung von Erklärungen für ausgewählte Transaktionen und das globale Verhalten sind Beispiele für laufende Aktivitäten.
Das Unternehmen kann entscheiden, wie es vorgehen möchte, wenn die Überwachungsgeräte erkennen, dass ein Schwellenwert überschritten wurde. Dies kann von Warnmeldungen bis hin zu Korrekturmaßnahmen reichen. Schritte zur Minderung von Verzerrungen oder zur Neuschulung von Modellen können konfiguriert werden, um ein fortlaufend vertrauenswürdiges Verhalten sicherzustellen. Modelle können aufgrund geschäftlicher oder technischer Kriterien außer Betrieb genommen werden. Diese Phase legt die äußersten Leitplanken für vertrauenswürdige KI fest.
Diese Phasen des KI-Lebenszyklus passen in ein allgemeines KI-Governance-Framework für das Unternehmen. Ein solches Framework ermöglicht es, dass verschiedene Anwendungsfälle die Lebenszyklusphasen konsistent durchlaufen, unabhängig davon, welche Entwicklungswerkzeuge verwendet werden. Es hilft bei der Automatisierung der Dokumentation über den gesamten Lebenszyklus hinweg und bietet verschiedenen Stakeholdern einen einheitlichen Überblick.
Die Operationalisierung vertrauenswürdiger KI erfordert die Zusammenführung von Menschen (Expertise), Prozessen (Best Practices) und Plattformen (Technologie). IBM Cloud Pak for Data und IBM Spectrum Fusion bieten das technologische Framework, das verschiedene Phasen des kompletten KI-Lebenszyklus unterstützt. Es kann in bestehende Umgebungen passen und bestehende Tools zur Modellentwicklung und -bereitstellung ergänzen. Die Plattform kann auf einer Vielzahl von Cloud-Optionen (IBM, AWS, Azure, GCP usw.) und lokalen Infrastrukturen laufen und bietet so eine echte hybride Cloud-Funktionalität.
IBM bietet eine Reihe von Serviceangeboten, die Bildung, Fachwissen, Best Practices und Technologie zusammenführen, um Kunden erste Schritte mit der Operationalisierung vertrauenswürdiger KI zu erleichtern.