Die Welt wird mit jedem Tag „intelligenter“, und um mit den Erwartungen der Verbraucher Schritt zu halten, setzen Unternehmen zunehmend Algorithmen des maschinellen Lernens ein, um die Dinge zu vereinfachen. Sie können sie auf Endbenutzergeräten verwenden (durch Gesichtserkennung zum Freischalten von Smartphones) oder um Kreditkartenbetrug zu erkennen (z. B. das Auslösen von Warnungen bei ungewöhnlichen Käufen).
Innerhalb der künstlichen Intelligenz (KI) und des maschinellen Lernens gibt es zwei grundlegende Ansätze: überwachtes Lernen und unüberwachtes Lernen. Der Hauptunterschied besteht darin, dass der eine gekennzeichnete Daten verwendet, um die Ergebnisse vorherzusagen, während der andere dies nicht tut. Allerdings gibt es einige Nuancen zwischen den beiden Ansätzen und Schlüsselbereiche, in denen der eine den anderen übertrifft. In diesem Beitrag werden die Unterschiede erläutert, damit Sie den besten Ansatz für Ihre Situation wählen können.
Branchen-Newsletter
Erhalten Sie kuratierte Einblicke in die wichtigsten – und faszinierendsten – KI-Neuheiten. Abonnieren Sie unseren wöchentlichen Think-Newsletter. Weitere Informationen in der IBM Datenschutzerklärung.
Ihr Abonnement wird auf Englisch geliefert. In jedem Newsletter finden Sie einen Abmeldelink. Hier können Sie Ihre Abonnements verwalten oder sich abmelden. Weitere Informationen finden Sie in unserer IBM Datenschutzerklärung.
Überwachtes Lernen ist ein maschinelles Lernverfahren, das sich durch die Verwendung von gekennzeichneten Datensätzen auszeichnet. Diese Datensätze sind dazu ausgelegt, Algorithmen zu trainieren oder zu überwachen, damit diese Daten genau klassifizieren oder Ergebnisse genau vorhersagen können. Anhand gekennzeichneter Eingaben und Ausgaben kann das Modell seine Genauigkeit messen und im Laufe der Zeit dazulernen.
Überwachtes Lernen kann beim Data Mining in zwei Problemkategorien unterteilt werden: Klassifizierung und Regression.
Beim unüberwachten Lernen werden maschinelle Lernalgorithmen verwendet, um Datensätze ohne Kennzeichnung zu analysieren und zu clustern. Diese Algorithmen entdecken versteckte Muster in Daten, ohne dass ein menschliches Eingreifen erforderlich ist (daher sind sie „unüberwacht“).
Unüberwachte Lernmodelle werden für drei Hauptaufgaben verwendet: Clustering, Assoziation und Dimensionalitätsreduzierung.
Der Hauptunterschied zwischen den beiden Ansätzen besteht in der Verwendung von gekennzeichneten Datensätzen. Einfach ausgedrückt verwendet überwachtes Lernen gekennzeichnete Eingabe- und Ausgabedaten, während ein unüberwachter Lernalgorithmus dies nicht tut.
Beim überwachten Lernen „lernt“ der Algorithmus aus dem Trainingsdatensatz, indem er iterativ Vorhersagen zu den Daten trifft und die richtige Antwort einstellt. Obwohl überwachte Lernmodelle tendenziell genauer sind als unüberwachte Lernmodelle, erfordern sie ein menschliches Eingreifen im Vorfeld, um die Daten angemessen zu kennzeichnen. Ein überwachtes Lernmodell kann beispielsweise vorhersagen, wie lange Ihre Fahrt zur Arbeit dauern wird, basierend auf Tageszeit, Wetterbedingungen und so weiter. Aber zuerst müssen Sie es trainieren, damit es weiß, dass regnerisches Wetter die Fahrzeit verlängert.
Im Gegensatz dazu arbeiten unüberwachte Lernmodelle selbstständig, um die inhärente Struktur von ungekennzeichneten Daten zu entdecken. Beachten Sie, dass für die Validierung von Ausgabevariablen weiterhin ein gewisser menschlicher Eingriff erforderlich ist. Ein unüberwachtes Lernmodell kann beispielsweise erkennen, dass Online-Käufer häufig Gruppen von Produkten gleichzeitig kaufen. Ein Datenanalyst müsste jedoch validieren, ob es für eine Empfehlungsmaschine sinnvoll ist, Babykleidung mit einer Bestellung von Windeln, Apfelmus und Trinkbechern zu gruppieren.
Die Wahl des richtigen Ansatzes für Ihre Situation hängt davon ab, wie Ihre Data Scientists die Struktur und das Volumen Ihrer Daten sowie den Anwendungsfall bewerten. Achten Sie bei Ihrer Entscheidungsfindung auf die folgenden Punkte:
Die Klassifizierung von Big Data kann beim überwachten Lernen eine echte Herausforderung sein, aber die Ergebnisse sind sehr genau und vertrauenswürdig. Im Gegensatz dazu kann unüberwachtes Lernen große Datenmengen in Echtzeit verarbeiten. Es fehlt jedoch an Transparenz darüber, wie Daten geclustert werden, und es besteht ein höheres Risiko ungenauer Ergebnisse. Hier kommt das semi-überwachte Lernen ins Spiel.
Sie können sich nicht entscheiden, ob Sie überwachtes oder unüberwachtes Lernen verwenden möchten? Semi-überwachtes Lernen ist ein guter Mittelweg, bei dem Sie einen Trainingsdatensatz mit gekennzeichneten und nicht gekennzeichneten Daten verwenden. Dies ist besonders nützlich, wenn es schwierig ist, relevante Funktionen aus Daten zu extrahieren – und wenn Sie über eine große Menge an Daten verfügen.
Halbüberwachtes Lernen ist ideal für medizinische Bilder, bei denen eine geringe Menge an Trainingsdaten zu einer deutlichen Verbesserung der Genauigkeit führen kann. So kann ein Radiologe beispielsweise eine kleine Untergruppe von CT-Scans mit Tumoren oder Krankheiten kennzeichnen, sodass das Gerät genauer vorhersagen kann, welche Patienten möglicherweise mehr medizinische Aufmerksamkeit benötigen.
Modelle für maschinelles Lernen sind eine leistungsfähige Möglichkeit, Datenerkenntnisse zu gewinnen, die unsere Welt verbessern. Um mehr über die spezifischen Algorithmen zu erfahren, die beim überwachten und unüberwachten Lernen verwendet werden, empfehlen wir Ihnen die Lektüre der Learn Hub-Artikel zu diesen Techniken. Wir empfehlen Ihnen auch, sich den Blogbeitrag anzusehen, der einen Schritt weiter geht und einen detaillierten Überblick über Deep Learning und neuronale Netze bietet.
Trainieren, validieren, optimieren und implementieren Sie generative KI, Foundation Models und maschinelle Lernfunktionen mit IBM watsonx.ai, einem Studio der nächsten Generation für AI Builder in Unternehmen. Erstellen Sie KI-Anwendungen mit einem Bruchteil der Zeit und Daten.
Setzen Sie KI in Ihrem Unternehmen ein – mit branchenführendem Fachwissen im Bereich KI und dem Lösungsportfolio von IBM an Ihrer Seite.
Erfinden Sie kritische Workflows und Abläufe neu, indem Sie KI einsetzen, um Erfahrungen, Entscheidungsfindung in Echtzeit und den geschäftlichen Nutzen zu maximieren.