Im Geschäftsleben ist Vertrauen die Voraussetzung für den Geschäftsbetrieb. „Vertrauen Sie uns“ ist kein Argument, besonders wenn es um KI geht. Als eines der ersten Unternehmen, das KI für Unternehmen entwickelt hat, orientiert sich IBM bei der KI-Entwicklung an Kernprinzipien, die auf Vertrauens- und Transparenzverpflichtungen beruhen. Mit den Produkten von IBM watsonx können Sie über die Rolle eines KI-Anwenders hinausgehen und zum KI-Wertschöpfer werden. Es verfügt über einen durchgängigen Prozess zum Aufbau und Testen von Foundation Models und generativer KI – von der Datenerfassung bis hin zu Kontrollpunkten zur Nachverfolgung der verantwortungsvollen Bereitstellungen von Modellen und Anwendungen – mit Fokus auf Governance, Risikobewertung, Vermeidung von Verzerrungen und Compliance.

Da die Granite-Modelle den Kunden zur Anpassung an ihre eigenen Anwendungen zur Verfügung stehen, durchläuft jeder im Training verwendete Datensatz einen definierten Governance-, Risiko- und Compliance-(GRC)-Überprüfungsprozess. Wir haben Governance-Verfahren zur Integration von Daten in den IBM Data Pile entwickelt, die mit den Prinzipien der IBM KI-Ethik übereinstimmen. Die Berücksichtigung der GRC-Kriterien für Daten erstreckt sich über den gesamten Lebenszyklus der Trainingsdaten. Unser Ziel ist es, eine überprüfbare Verbindung von einem trainierten Foundation Model bis zurück zu der spezifischen Datensatzversion herzustellen, auf der das Modell trainiert wurde.

Viele Medien haben sich (zu Recht) auf das Risiko konzentriert, dass generative KI hasserfüllte oder verleumderische Ausgaben produziert. Bei IBM wissen wir, dass sich Unternehmen solche Risiken nicht leisten können. Deshalb werden unsere granite Modelle mit Daten trainiert, die von unserem eigenen „HAP-Detektor“ geprüft werden. Dabei handelt es sich um ein von IBM trainiertes Sprachmodell, das hasserfüllte und obszöne Inhalte erkennt und ausmerzt. Es wird sowohl mit internen als auch mit öffentlichen Modellen verglichen. Nachdem jedem Satz in einem Dokument eine Punktzahl zugewiesen wurde, werden Analyse über die Sätze und Punktzahlen durchgeführt, um die Verteilung zu erkunden, die den Prozentsatz der zu filternden Sätze bestimmt.

Darüber hinaus wenden wir eine Vielzahl weiterer Qualitätsmaßnahmen an. Wir suchen und entfernen Duplikate, die die Qualität der Ausgabe verbessern, und verwenden Filter für die Dokumentenqualität, um Dokumente von geringer Qualität, die nicht für Schulungen geeignet sind, weiter zu entfernen. Wir bieten außerdem regelmäßige und fortlaufende Datenschutzmaßnahmen an, darunter die Überwachung von Webseiten, die für das Raubkopieren von Inhalten oder das Veröffentlichen anderer anstößiger Inhalte bekannt sind, und die Vermeidung dieser Webseiten.

Und da sich die Landschaft der generativen KI-Technologien ständig verändert, wird sich unser End-to-End-Prozess kontinuierlich weiterentwickeln und verbessern, um Unternehmen Ergebnisse zu liefern, denen sie vertrauen können.