Was ist überwachtes Lernen?
Erfahren Sie, wie überwachtes Lernen funktioniert und wie Sie damit hochpräzise maschinelle Lernmodelle erstellen können
Blauer Hintergrund mit blau-grünen Dreiecken
Was ist überwachtes Lernen?

Überwachtes Lernen, auch bekannt als überwachtes maschinelles Lernen, ist eine Unterkategorie des maschinellen Lernens und der künstlichen Intelligenz. Es zeichnet sich dadurch aus, dass es markierte Datensätze verwendet, um Algorithmen zu trainieren, die Daten klassifizieren oder Ergebnisse korrekt vorhersagen können. Während die Eingabedaten in das Modell eingespeist werden, passt es seine Gewichtungen an, bis das Modell angemessen angepasst ist, was als Teil des Kreuzvalidierungsverfahrens erfolgt. Überwachtes Lernen hilft Unternehmen bei der Lösung einer Vielzahl von realen Problemen in großem Umfang, z. B. bei der Klassifizierung von Spam in einem separaten Ordner für den Posteingang.

Relevante Produkte

Watson Studio

SPSS Statistics

So funktioniert überwachtes Lernen

Beim überwachten Lernen wird ein Trainingsdatensatz verwendet, um Modelle so zu trainieren, dass sie die gewünschte Ausgabe liefern. Dieser Trainingsdatensatz enthält Eingaben und korrekte Ausgaben, die es dem Modell ermöglichen, mit der Zeit zu lernen. Der Algorithmus misst seine Genauigkeit anhand der Verlustfunktion und passt sich an, bis der Fehler ausreichend minimiert ist.

Das überwachte Lernen kann beim Data-Mining in zwei Arten von Problemen unterteilt werden – Klassifizierung und Regression:

  • Bei der Klassifizierung wird ein Algorithmus verwendet, um Testdaten korrekt in bestimmte Kategorien einzuordnen. Sie erkennt bestimmte Entitäten im Datensatz und versucht, einige Schlussfolgerungen zu ziehen, wie diese Entitäten beschriftet oder definiert werden sollten. Gängige Klassifizierungsalgorithmen sind lineare Klassifikatoren, Support Vector Machines (SVM), Entscheidungsbäume, k-Nearest Neighbor und Random Forest, die im Folgenden näher beschrieben werden.
  • Regression wird verwendet, um die Beziehung zwischen abhängigen und unabhängigen Variablen zu verstehen. Sie wird häufig verwendet, um Prognosen zu erstellen, z. B. für die Umsatzerlöse eines bestimmten Unternehmens. Lineare Regressionlogistische Regression und polynomiale Regression sind beliebte Regressionsalgorithmen.
Algorithmen des überwachten Lernens

Bei überwachten maschinellen Lernprozessen werden verschiedene Algorithmen und Berechnungstechniken eingesetzt. Nachfolgend finden Sie kurze Erläuterungen zu einigen der am häufigsten verwendeten Lernmethoden, die in der Regel mit Programmen wie R oder Python berechnet werden:

  • Neuronale Netze: Neuronale Netze werden in erster Linie für Deep-Learning-Algorithmen eingesetzt. Neuronale Netze verarbeiten Trainingsdaten, indem sie die Vernetzung des menschlichen Gehirns durch mehrere Knotenebenen nachbilden. Jeder Knoten besteht aus Eingängen, Gewichten, einem Schwellenwert und einem Ausgang. Wenn dieser Ausgangswert einen bestimmten Schwellenwert überschreitet, wird der Knoten „gezündet“ oder aktiviert und die Daten werden an die nächste Ebene des Netzes weitergeleitet. Neuronale Netze erwerben diese Zuordnungsfunktion durch überwachtes Lernen, wobei sie sich auf der Grundlage der Verlustfunktion durch den Prozess des Gradientenabstiegs anpassen. Wenn die Kostenfunktion bei oder nahe Null liegt, kann davon ausgegangen werden, dass das Modell die richtige Antwort liefert.
  • Naive Bayes: Naive Bayes ist ein Klassifizierungsansatz, bei dem das Prinzip der bedingten Unabhängigkeit der Klassen aus dem Bayes-Theorem übernommen wird. Das bedeutet, dass das Vorhandensein eines Merkmals keinen Einfluss auf das Vorhandensein eines anderen Merkmals in Bezug auf die Wahrscheinlichkeit eines bestimmten Ergebnisses hat und dass jeder Prädiktor die gleiche Wirkung auf dieses Ergebnis hat. Es gibt drei Arten von naiven Bayes-Klassifikatoren: Multinomial Naive Bayes, Bernoulli Naive Bayes und Gaussian Naive Bayes. Dieses Verfahren wird vor allem bei der Textklassifizierung, der Spam-Erkennung und bei Empfehlungssystemen eingesetzt.
  • Lineare Regression: Die lineare Regression wird verwendet, um die Beziehung zwischen einer abhängigen Variable und einer oder mehreren unabhängigen Variablen zu ermitteln, und wird in der Regel genutzt, um Vorhersagen über zukünftige Ergebnisse zu treffen. Wenn es nur eine unabhängige Variable und eine abhängige Variable gibt, spricht man von einer einfachen linearen Regression. Wenn die Zahl der unabhängigen Variablen zunimmt, spricht man von mehrfacher linearer Regression. Für jede Art von linearer Regression wird versucht, eine Linie der besten Anpassung zu zeichnen, die nach der Methode der kleinsten Quadrate berechnet wird. Im Gegensatz zu anderen Regressionsmodellen ist diese Linie jedoch gerade, wenn sie in ein Diagramm eingetragen wird.
  • Logistische Regression: Während die lineare Regression eingesetzt wird, wenn die abhängigen Variablen kontinuierlich sind, wird die logistische Regression gewählt, wenn die abhängigen Variablen kategorisch sind, d. h. sie haben binäre Ausgaben wie „wahr“ und „falsch“ oder „ja“ und „nein“. Während beide Regressionsmodelle darauf abzielen, Beziehungen zwischen Dateneingaben zu verstehen, wird die logistische Regression hauptsächlich zur Lösung von binären Klassifizierungsproblemen verwendet, z. B. zur Identifizierung von Spam.
  • Support Vector Machine (SVM): Eine Support Vector Machine ist ein beliebtes Modell für überwachtes Lernen, das von Vladimir Vapnik entwickelt wurde und sowohl für die Klassifizierung als auch für die Regression von Daten verwendet wird. Sie wird in der Regel für Klassifizierungsprobleme genutzt, indem eine Hyperebene konstruiert wird, in der der Abstand zwischen zwei Klassen von Datenpunkten am größten ist. Diese Hyperebene wird als Entscheidungsgrenze bezeichnet und trennt die Klassen der Datenpunkte (z. B. Orangen vs. Äpfel) auf beiden Seiten der Ebene.
  • K-Nearest Neighbor (KNN): K-Nearest Neighbor, auch bekannt als KNN-Algorithmus, ist ein nicht parametrischer Algorithmus, der Datenpunkte auf der Grundlage ihrer Nähe und Assoziation zu anderen verfügbaren Daten klassifiziert. Dieser Algorithmus geht davon aus, dass ähnliche nah beieinander liegende Datenpunkte gefunden werden können. Infolgedessen wird versucht, den Abstand zwischen den Datenpunkten zu berechnen, in der Regel durch die euklidische Distanz, und anschließend wird eine Kategorie auf der Grundlage der häufigsten Kategorie oder des Durchschnitts zugewiesen. Seine Benutzerfreundlichkeit und die kurze Berechnungszeit machen ihn zu einem bevorzugten Algorithmus für Datenwissenschaftler, aber je größer der Testdatensatz wird, desto länger dauert die Verarbeitung, was ihn für Klassifizierungsaufgaben weniger attraktiv macht. KNN wird in der Regel für Empfehlungs-Engines und Bilderkennung verwendet.
  • Random Forest: Random Forest ist ein weiterer flexibler Algorithmus für überwachtes maschinelles Lernen, der sowohl für Klassifizierungs- als auch für Regressionszwecke verwendet wird. „Forest“ („Wald“) bezieht sich auf eine Sammlung von unkorrelierten Entscheidungsbäumen, die dann zusammengeführt werden, um die Varianz zu verringern und genauere Datenvorhersagen zu erstellen.

 

Unüberwachtes vs. überwachtes vs. halb-überwachtes Lernen

Unüberwachtes maschinelles Lernen und überwachtes maschinelles Lernen werden häufig gemeinsam diskutiert. Im Gegensatz zum überwachten Lernen werden beim unüberwachten Lernen unmarkierte Daten verwendet. Anhand dieser Daten lassen sich Muster erkennen, die bei der Lösung von Clustering- oder Zuordnungsproblemen helfen. Dies ist besonders nützlich, wenn Experten sich über gemeinsame Eigenschaften innerhalb eines Datensatzes unsicher sind. Gängige Clustering-Algorithmen sind hierarchische, k-Means- und Gaußsche Mischmodelle.

Beim halb-überwachten Lernen wird nur ein Teil der gegebenen Eingabedaten gekennzeichnet. Unüberwachtes und halb-überwachtes Lernen können attraktivere Alternativen sein, da es zeitaufwendig und kostspielig sein kann, sich auf Fachwissen zu verlassen, um Daten für überwachtes Lernen angemessen zu kennzeichnen.

Wenn Sie mehr über die Unterschiede zwischen diesen Ansätzen erfahren möchten, sehen Sie sich „Supervised vs. Unsupervised Learning: What's the Difference?“ an.

Beispiele für überwachtes Lernen

Modelle des überwachten Lernens können zum Aufbau und zur Weiterentwicklung einer Reihe von Geschäftsanwendungen verwendet werden, darunter die folgenden:

  • Bild- und Objekterkennung: Algorithmen des überwachten Lernens können verwendet werden, um Objekte in Videos oder Bildern zu lokalisieren, zu isolieren und zu kategorisieren, was sie für verschiedene Computer-Bildverarbeitungsverfahren und Bildanalysen nützlich macht.
  • Prädiktive Analyse: Ein weit verbreiteter Anwendungsfall für Modelle des überwachten Lernens ist die Erstellung von prädiktiven Analysesystemen, die tiefe Einblicke in verschiedene Geschäftsdatenpunkte ermöglichen. Diese ermöglicht es Unternehmen, bestimmte Ergebnisse auf der Grundlage einer bestimmten Ausgangsvariablen vorherzusehen, was den Führungskräften hilft, Entscheidungen zu rechtfertigen oder letzteren zum Nutzen des Unternehmens eine andere Richtung zu geben.
  • Analyse der Kundenstimmung: Mithilfe überwachter Algorithmen für maschinelles Lernen können Unternehmen wichtige Informationen aus großen Datenmengen extrahieren und klassifizieren – einschließlich Kontext, Emotionen und Absichten – und das mit sehr wenig menschlichem Zutun. Diese kann unglaublich nützlich sein, um ein besseres Verständnis der Kundeninteraktionen zu erlangen, und kann zur Verbesserung der Bemühungen zur Markenbindung genutzt werden.
  • Spam-Erkennung: Die Spam-Erkennung ist ein weiteres Beispiel für ein überwachtes Lernmodell. Mithilfe überwachter Klassifizierungsalgorithmen können Unternehmen Datenbanken trainieren, um Muster oder Anomalien in neuen Daten zu erkennen und Spam- und Nicht-Spam-Korrespondenzen effektiv zu organisieren.
Herausforderungen des überwachten Lernens

Obwohl das überwachte Lernen Unternehmen Vorteile bieten kann, wie z. B. tiefe Dateneinblicke und verbesserte Automation, gibt es einige Herausforderungen beim Aufbau nachhaltiger überwachter Lernmodelle. Im Folgenden werden einige dieser Herausforderungen beschrieben:

  • Modelle des überwachten Lernens können ein gewisses Maß an Fachwissen erfordern, um korrekt zu strukturieren.
  • Das Training von Modellen des überwachten Lernens kann sehr zeitintensiv sein.
  • Datensätze können eine höhere Wahrscheinlichkeit für menschliche Fehler aufweisen, was dazu führt, dass Algorithmen falsch lernen.
  • Im Gegensatz zu Modellen des unüberwachten Lernens kann das überwachte Lernen Daten nicht selbständig clustern oder klassifizieren.
Relevante Lösungen
IBM® Watson Studio

Erstellen und skalieren Sie vertrauenswürdige KI in jeder Cloud. Automatisieren Sie den KI-Lebenszyklus für ModelOps.

IBM® Watson Studio erkunden
Cloud Pak for Data

Verbinden Sie die richtigen Daten zur richtigen Zeit mit den richtigen Personen – von überall, wo sie benötigt werden.

Cloud Pak for Data erkunden
IBM Cloud-Lösungen

Hybrid. Offen. Ausfallsicher. Ihre Plattform und Ihr Partner für digitale Transformation.

Cloud-Lösungen erkunden
Ressourcen Überwachtes vs. unüberwachtes Lernen: Was ist der Unterschied?

In diesem Artikel werden die Grundlagen zweier Ansätze der Datenwissenschaft untersucht: überwacht und unüberwacht.

Modelle zum überwachten Lernen

Erkunden Sie einige Ansätze zum überwachten Lernen wie Support Vector Machines und probabilistische Klassifikatoren

Machen Sie den nächsten Schritt

Modelle des überwachten Lernens können eine wertvolle Lösung sein, um manuelle Klassifizierungsarbeiten zu eliminieren und zukünftige Vorhersagen auf der Grundlage markierter Daten zu treffen. Die Formatierung Ihrer maschinellen Lernalgorithmen erfordert jedoch menschliches Wissen und Fachkenntnisse, um eine Überanpassung der Datenmodelle zu vermeiden.IBM und seine Data-Science- und KI-Teams haben Jahre damit verbracht, die Entwicklung und den Einsatz von überwachten Lernmodellen mit zahlreichen geschäftlichen Anwendungsfällen zu perfektionieren. Mithilfe leistungsstarker Tools wie IBM Watson Studio auf IBM Cloud Pak for Data können Unternehmen hoch skalierbare Modelle für maschinelles Lernen erstellen, unabhängig davon, wo sich ihre Daten befinden, und werden dabei von der stabilen hybriden Multi-Cloud-Umgebung von IBM unterstützt.

IBM® Watson Studio erkunden