Technologien des maschinellen Lernens (ML) können die Entscheidungsfindung in praktisch allen Branchen vorantreiben, vom Gesundheitswesen über das Personalwesen bis hin zum Finanzwesen und in unzähligen Anwendungsfällen wie Computer Vision, Large Language Models (LLMs), Spracherkennung, selbstfahrenden Autos und mehr.
Der wachsende Einfluss von ML ist jedoch nicht ohne Komplikationen. Die Validierungs- und Trainingsdatensätze, die der ML-Technologie zugrunde liegen, werden oft von Menschen aggregiert, und Menschen sind anfällig für Verzerrungen und Fehler. Selbst in Fällen, in denen ein ML-Modell selbst nicht verzerrt oder fehlerhaft ist, kann die Bereitstellung im falschen Kontext zu Fehlern mit unbeabsichtigten schädlichen Folgen führen.
Deshalb kann sich die Diversifizierung der KI- und ML-Nutzung in Unternehmen als unschätzbar wertvoll erweisen, um einen Wettbewerbsvorteil zu erhalten. Jeder Typ und Untertyp von ML-Algorithmen hat einzigartige Vorteile und Fähigkeiten, die Teams für verschiedene Aufgaben nutzen können. Hier besprechen wir die fünf Haupttypen und ihre Anwendungen.
ML ist ein Teilbereich von Informatik, Data Science und künstlicher Intelligenz (KI), der es Systemen ermöglicht, ohne zusätzliche Programmierinterventionen aus Daten zu lernen und Verbesserungen vorzunehmen.
Anstatt explizite Anweisungen zur Leistungsoptimierung zu verwenden, stützen sich ML-Modelle auf Algorithmen und statistische Modelle, die Aufgaben auf der Grundlage von Datenmustern und Schlussfolgerungen ausführen. Mit anderen Worten: ML nutzt Eingabedaten, um Ausgaben vorherzusagen, und aktualisiert die Ausgaben kontinuierlich, sobald neue Daten verfügbar werden.
Auf Einzelhandels-Websites beispielsweise beeinflussen Algorithmen für maschinelles Lernen die Kaufentscheidungen der Verbraucher, indem sie Empfehlungen auf der Grundlage der Kaufhistorie abgeben. Die E-Commerce-Plattformen vieler Einzelhändler – darunter IBM, Amazon, Google, Meta und Netflix – nutzen künstliche neuronale Netze (KNN), um personalisierte Empfehlungen bereitzustellen. Und Einzelhändler nutzen häufig Daten von Chatbots und virtuellen Assistenten in Kombination mit ML- und NLP-Technologie (Natural Language Processing), um das Einkaufserlebnis der Benutzer zu automatisieren.
Algorithmen für maschinelles Lernen lassen sich in fünf große Kategorien einteilen: überwachtes Lernen, unüberwachtes Lernen, halbüberwachtes Lernen, selbstüberwachtes Lernen und bestärkendes Lernen.
Überwachtes maschinelles Lernen ist eine Art maschinelles Lernen, bei dem das Modell in einem beschrifteten Dataset geschult wird (d. h. die Ziel- oder Ergebnisvariable ist bekannt). Wenn Data Scientists beispielsweise ein Modell für das Forecasting von Tornados erstellen, könnten die Eingabevariablen Datum, Ort, Temperatur, Windströmungsmuster und mehr umfassen, und die Ausgabe wäre die tatsächliche Tornadoaktivität, die für diese Tage aufgezeichnet wurde.
Überwachtes Lernen wird häufig für die Risikobewertung, Bilderkennung, Vorhersageanalysen und Betrugserkennung eingesetzt und umfasst mehrere Arten von Algorithmen.
Algorithmen für das unüberwachte Lernen – wie Apriori, Gauss'sche Mischverteilungsmodelle (GMM) und die Hauptkomponentenanalyse (PCA) – ziehen Rückschlüsse aus unbeschrifteten Datensätzen, erleichtern die explorative Datenanalyse und ermöglichen die Mustererkennung und die Erstellung von Vorhersagemodellen.
Die häufigste Methode des unüberwachten Lernens ist die Clusteranalyse, bei der Datenpunkte mithilfe von Clustering-Algorithmen nach Wertähnlichkeit kategorisiert werden (wie bei der Kundensegmentierung oder Anomalieerkennung). Assoziationsalgorithmen ermöglichen es Data Scientists, Zusammenhänge zwischen Datenobjekten in großen Datenbanken zu erkennen, was die Datenvisualisierung und die Reduzierung der Dimensionalität erleichtert.
Unüberwachte ML-Modelle stehen oft hinter den Empfehlungssystemen des Typs „Kunden, die dies gekauft haben, kauften auch …“.
Selbstüberwachtes Lernen (Self-Supervised Learning, SSL) ermöglicht es Modellen, sich selbst anhand von nicht gekennzeichneten Daten zu trainieren, anstatt umfangreiche annotierte und/oder gekennzeichnete Datensätze zu benötigen. SSL-Algorithmen, auch als prädiktive oder Vorwand-Lernalgorithmen bezeichnet, lernen einen Teil der Eingabe aus einem anderen Teil, generieren automatisch Labels und wandeln unbeaufsichtigte Probleme in überwachte um. Diese Algorithmen sind besonders nützlich für Aufgaben wie Computer Vision und NLP, bei denen die Menge der für das Training von Modellen erforderlichen gekennzeichneten Trainingsdaten außergewöhnlich groß sein kann (manchmal sogar zu groß).
Verstärkendes Lernen, auch Verstärkendes Lernen durch menschliches Feedback (Reinforcement Learning from Human Feedback, RLHF) genannt, ist eine Art dynamische Programmierung, bei der Algorithmen mithilfe eines Systems aus Belohnung und Bestrafung trainiert werden. Beim Einsatz von verstärkendem Lernen ergreift ein Agent Maßnahmen in einer bestimmten Umgebung, um ein vorgegebenes Ziel zu erreichen. Der Agent wird für seine Handlungen auf der Grundlage einer festgelegten Metrik (in aller Regel nach einem Punktesystem) belohnt oder bestraft, wodurch er dazu ermutigt wird, bewährte Verfahren fortzusetzen und schlechte zu verwerfen. Durch Wiederholung lernt der Agent die besten Strategien.
Algorithmen für verstärkendes Lernen sind in der Videospielentwicklung weit verbreitet und werden häufig eingesetzt, um Robotern beizubringen, wie sie menschliche Aufgaben replizieren können.
Die fünfte Art von maschinellem Lernen bietet eine Kombination aus überwachtem und unüberwachtem Lernen.
Halbüberwachte Lernalgorithmen werden anhand eines kleinen markierten Datensatzes und eines großen unmarkierten Datensatzes trainiert, wobei die markierten Daten den Lernprozess für den größeren Teil der unmarkierten Daten leiten. Ein halbüberwachtes Lernmodell könnte unüberwachtes Lernen verwenden, um Datencluster zu identifizieren, und dann überwachtes Lernen verwenden, um die Cluster zu kennzeichnen.
Generative Adversarial Networks (GANs) – ein Tool für Deep Learning, das durch das Training zweier neuronaler Netze unmarkierte Daten generiert – sind ein Beispiel für halbüberwachtes maschinelles Lernen.
Unabhängig von der Art können ML-Modelle Dateneinblicke aus Unternehmensdaten gewinnen, aber ihre Anfälligkeit für menschliche/datenbezogene Verzerrungen macht verantwortungsvolle KI-Praktiken zu einer organisatorischen Notwendigkeit.
Fast jeder, von Entwicklern über Anwender bis hin zu Regulierungsbehörden, beschäftigt sich irgendwann mit Anwendungen des maschinellen Lernens, unabhängig davon, ob sie direkt mit KI-Technologie interagieren oder nicht. Und die Einführung der ML-Technologie nimmt nur noch mehr Fahrt auf. Der globale Markt für maschinelles Lernen wurde (Link befindet sich außerhalb von ibm.com) im Jahr 2022 auf 19 Milliarden US-Dollar geschätzt und wird bis 2030 voraussichtlich 188 Milliarden US-Dollar erreichen (eine jährliche Wachstumsrate von mehr als 37 Prozent).
Das Ausmaß der ML-Einführung und ihre wachsenden geschäftlichen Auswirkungen machen das Verständnis von KI- und ML-Technologien zu einer fortwährenden – und äußerst wichtigen – Verpflichtung, die eine sorgfältige Überwachung und rechtzeitige Anpassungen im Zuge der technologischen Weiterentwicklung erfordert. Mit IBM watsonx.ai Mit AI Studio können Entwickler ML-Algorithmen und -Prozesse mühelos verwalten.
IBM watsonx.ai – Teil der IBM watsonx® KI- und Datenplattform – kombiniert neue generative KI-Funktionen und ein Enterprise Studio der nächsten Generation, um KI-Entwicklern dabei zu helfen, KI-Modelle mit einem Bruchteil der Daten in einem Bruchteil der Zeit zu trainieren, zu validieren, zu optimieren und einzusetzen. Watsonx.ai bietet Teams fortschrittliche Funktionen zur Datengenerierung und -klassifizierung, die Unternehmen dabei helfen, Dateneinblicke für eine optimale KI-Leistung in der Praxis zu nutzen.
Im Zeitalter der Datenverbreitung sind KI und maschinelles Lernen aus dem täglichen Geschäftsbetrieb ebenso wenig wegzudenken wie aus der technischen Innovation und dem Wettbewerb. Als neue Säulen einer modernen Gesellschaft bieten sie aber auch die Möglichkeit, die IT-Infrastrukturen von Unternehmen zu diversifizieren und Technologien zu entwickeln, die Unternehmen und den Menschen, die von ihnen abhängig sind, zugutekommen.
Erkunden Sie das watsonx.ai AI Studio