Die Begriffe „Algorithmus“ und „Modell“ werden oft synonym verwendet, stehen aber für unterschiedliche (wenn auch verwandte) Konzepte. Algorithmus ist ein Oberbegriff für einen Schritt-für-Schritt-Prozess, der normalerweise in mathematischer Sprache oder Pseudocode beschrieben wird, um eine Funktion oder einen Zweck auszuführen. Im Kontext der künstlichen Intelligenz ist ein KI-Modell jedes Programm, das Eingabe empfängt und eine Vorhersage oder Entscheidung ohne weiteres menschliches Eingreifen ausgibt.
Ein Algorithmus für maschinelles Lernen ist eine definierte Reihe von Schritten, die verwendet werden, um ein maschinelles Lernmodell zu schulen, damit es in seinem realen Anwendungsfall nützliche Vorhersagen treffen kann. Es umfasst nicht nur die Art und Weise, wie das Modell einen Eingabedatenpunkt der entsprechenden Ausgabe zuordnet, sondern auch den Prozess der Optimierung der Vorhersagen des Modells, um einen Trainingsdatensatz mit relevanten Beispielen „anzupassen“. Es handelt sich um einen Algorithmus , der es einer Maschine ermöglicht, aus Daten zu lernen.
Einfach ausgedrückt ist das Ergebnis der Anwendung eines maschinellen Lernalgorithmus auf einen Datensatz ein trainiertes Modell. „Training“ kann als ein iterativer Prozess verstanden werden, bei dem die Parameter des Modells – die anpassbaren Aspekte der mathematischen Logik, die das Modell verwendet, um Vorhersagen oder Entscheidungen über die Eingabe zu treffen – auf eine Weise aktualisiert werden, die nützlichere Ausgaben liefert.
Obwohl es Algorithmen für maschinelles Lernen (ML) gibt, die explizit für das Training von Modellen entwickelt wurden, um eine einzelne Aufgabe auszuführen, ist dies eher eine Ausnahme als eine Regel. Im Allgemeinen verfügt jeder ML-Algorithmus über bestimmte mathematische oder praktische Eigenschaften, die für bestimmte Arten von Aufgaben (oder bestimmte Arten oder Mengen von Daten) nützlich sind. In vielen Fällen kann dieselbe Technik des maschinellen Lernens verwendet werden, um Modelle für mehrere (wenn auch ähnliche) Aufgaben zu schulen. Umgekehrt gibt es fast immer mehrere ML-Algorithmen, die sich gut eignen, um ein Modell für eine bestimmte Aufgabe zu trainieren.
Der zentrale Vorteil von ML-Algorithmen besteht darin, dass sie KI-Modelle in die Lage versetzen, implizit aus Erfahrung zu lernen. Dies steht im Gegensatz zu „klassischen“ oder „regelbasierten“ KI-Techniken, bei denen ein Data Scientist, Experte oder ML-Ingenieur die Entscheidungsfindung des Modells manuell und explizit programmieren muss. In den letzten Jahrzehnten haben sich maschinelle Lernsysteme als die vorherrschende Methode der künstlichen Intelligenz und Datenanalyse gegenüber der regelbasierten KI herauskristallisiert, weil das implizite datengesteuerte maschinelle Lernen von Natur aus flexibler, skalierbarer und zugänglicher ist.
Allerdings ist es wichtig zu beachten, dass die Anpassung eines Modells an seine Trainingsdaten nur ein Mittel zum Zweck ist. Die grundlegende Prämisse des maschinellen Lernens ist, dass, wenn Sie die Leistung eines Modells anhand von Beispielaufgaben optimieren, die den realen Problemen, für die es verwendet werden soll, angemessen ähneln, das trainierte Modell auch bei neuen Daten, die es beim Training nicht gesehen hat, gut abschneidet. Das ultimative Ziel des maschinellen Lernens ist die Generalisierung, die Übersetzung der Leistung von Trainingsdaten in neue, unbekannte Daten. Ein kurzsichtiger Fokus auf das Training an sich birgt die Gefahr einer Überanpassung, ein Phänomen, bei dem das Wissen eines Modells so gründlich auf Muster in seinen Trainingsdaten zugeschnitten ist, dass es nicht verallgemeinern kann, was zu einem Modell führt, das sich im Training auszeichnet, aber in realen Szenarien versagt.
Das Training eines nützlichen maschinellen Lernmodells umfasst daher nicht nur die Auswahl und Konfiguration eines geeigneten Typs von ML-Algorithmus, sondern auch die richtige Pflege von Trainingsdaten und eine sorgfältige Validierung der Leistung.