Unüberwachtes Lernen und überwachtes Lernen werden häufig zusammen genannt. Im Gegensatz zu Algorithmen für unüberwachtes Lernen verwenden Algorithmen für überwachtes Lernen gekennzeichnete Daten. Aus diesen Daten werden entweder zukünftige Ergebnisse prognostiziert oder Daten bestimmten Kategorien zugeordnet, basierend auf dem Regressions- oder Klassifikationsproblem, das es zu lösen gilt.
Obwohl überwachte Lernalgorithmen in der Regel genauer sind als unüberwachte Lernmodelle, erfordern sie ein menschliches Eingreifen im Vorfeld, um die Daten angemessen zu kennzeichnen. Dank dieser gekennzeichneten Datensätze kann jedoch eine Rechenkomplexität für überwachte Lernalgorithmen vermieden werden, da keine große Trainingsmenge benötigt werden, um die beabsichtigten Ergebnisse zu erzielen. Gängige Regressions- und Klassifizierungstechniken sind lineare und logistische Regression, Naive Bayes, KNN-Algorithmus und Random Forest.
Von halbüberwachtem Lernen sprechen wir, wenn nur ein Teil der vorhandenen Eingabedaten gekennzeichnet wurde. Unüberwachtes und halbüberwachtes Lernen können attraktivere Alternativen darstellen, da es zeitaufwändig und kostspielig sein kann, sich auf Fachwissen zu verlassen, um Daten für überwachtes Lernen angemessen zu kennzeichnen.
Einen detaillierten Einblick in die Unterschiede zwischen diesen Ansätzen finden Sie unter „Überwachtes vs. unüberwachtes Lernen: Was ist der Unterschied? “