Maschinelles Lernen

menu icon

Maschinelles Lernen

Maschinelles Lernen konzentriert sich auf Anwendungen, die aus Erfahrung lernen und ihre Entscheidungsfindung oder Vorhersagegenauigkeit im Laufe der Zeit verbessern.

Was ist maschinelles Lernen?

Maschinelles Lernen ist ein Zweig künstlicher Intelligenz (KI), der sich auf die Erstellung von Anwendungen konzentriert, die aus Daten lernen und ihre Genauigkeit im Laufe der Zeit verbessern, ohne dafür programmiert zu werden. 

In der Datenwissenschaft ist ein Algorithmus eine Folge von statistischen Verarbeitungsschritten. Beim maschinellen Lernen werden Algorithmen „trainiert“, um Muster und Features in riesigen Datenmengen zu finden und auf der Grundlage neuer Daten Entscheidungen und Vorhersagen zu treffen. Je besser der Algorithmus ist, desto genauer werden die Entscheidungen und Vorhersagen, wenn mehr Daten verarbeitet werden.

Heute sind wir von Beispielen für maschinelles Lernen umgeben. Digitale Assistenten durchsuchen das Web und spielen Musik als Antwort auf unsere Sprachbefehle. Websites empfehlen Produkte sowie Filme und Lieder basierend auf dem, was wir zuvor gekauft, angeschaut oder gehört haben. Roboter saugen Staub während wir ... etwas besseres mit unserer Zeit anfangen. Spam-Detektoren halten unsere Posteingänge frei von unerwünschten E-Mails. Mit Systemen für die medizinische Bilddatenanalyse können Ärzte Tumore erkennen, die sie möglicherweise übersehen hätten. Und die ersten autonomen Autos fahren auf unseren Straßen.

Wir können mehr erwarten. Da Big Data weiter zunehmen, die Datenverarbeitung immer leistungsfähiger und erschwinglicher wird und Datenwissenschaftler immer leistungsfähigere Algorithmen entwickeln, werden unsere Privat- und Berufsleben durch maschinelles Lernen immer effizienter werden. 

So funktioniert maschinelles Lernen

Es gibt vier grundlegende Schritte für die Erstellung einer Anwendung (oder eines Modells) für maschinelles Lernen. Diese werden in der Regel von Datenwissenschaftlern durchgeführt, die eng mit den Fachleuten zusammenarbeiten, für die das Modell entwickelt wird.

Schritt 1: Auswahl und Vorbereitung eines Trainingsdatenbestands

Trainingsdaten sind ein Datenbestand, der für die Daten repräsentativ ist, die das Modell für maschinelles Lernen aufnehmen wird, um das Problem zu lösen, das es zu lösen gilt. In einigen Fällen sind die Trainingsdaten markierte Daten – mit einer Kennung, um Features und Klassifizierungen zu senden, die das Modell identifizieren muss. Andere Daten sind nicht markiert, und das Modell muss diese Features extrahieren und Klassifizierungen sich selbst zuordnen.

In beiden Fällen müssen die Trainingsdaten ordnungsgemäß vorbereitet werden – randomisiert, dedupliziert und auf Ungleichgewichte oder Verzerrungen überprüft werden, die sich auf das Training auswirken könnten. Sie sollten zudem in zwei Untergruppen aufgeteilt werden: Training zum Trainieren der Anwendung und Auswertung zum Testen und Optimieren der Anwendung.

Schritt 2: Auswahl  eines Algorithmus zur Ausführung im Trainingsdatenbestand

Ein Algorithmus ist wiederum eine Gruppe statistischer Verarbeitungsschritte. Der Typ des Algorithmus hängt vom Typ (markiert oder nicht markiert) und vom Datenvolumen im Trainingsdatenbestand sowie von der Art des Problems ab, das gelöst werden soll.

Allgemeine Typen von Algorithmen für maschinelles Lernen zur Verwendung mit markierten Daten umfassen folgende:

  • Regressionsalgorithmen: Lineare und logistische Regression sind Beispiele für Regressionsalgorithmen, die verwendet werden, um Abhängigkeiten in Daten zu verstehen. Lineare Regression wird verwendet, um den Wert einer abhängigen Variablen basierend auf dem Wert einer unabhängigen Variablen vorherzusagen. Logistische Regression kann verwendet werden, wenn die abhängige Variable binär ist: A oder B. Zum Beispiel könnte ein linearer Regressionsalgorithmus trainiert werden, um den Jahresumsatz eines Verkäufers (die abhängige Variable) auf der Grundlage seiner Abhängigkeit von der Ausbildung oder jahrelangen Erfahrung des Verkäufers vorherzusagen (die unabhängigen Variablen). Eine andere Art von Regressionsalgorithmus, der als Support Vector Machine bezeichnet wird, ist nützlich, wenn abhängige Variablen schwieriger zu klassifizieren sind.
  • Entscheidungsbäume: Entscheidungsbäume verwenden klassifizierte Daten, um basierend auf einer Reihe von Entscheidungsregeln Empfehlungen abzugeben. Beispiel: Ein Entscheidungsbaum, der empfiehlt, auf ein bestimmtes Pferd zu setzen (Win, Place, Show), könnte Daten über das Pferd (z. B. Alter, Prozentsatz der Siege, Abstammung) verwenden und Regeln auf diese Faktoren anwenden, um eine Aktion oder Entscheidung zu empfehlen.
  • Instanzbasierte Algorithmen: Ein gutes Beispiel für einen instanzbasierten Algorithmus ist K-Nearest Neighbor oder k-nn. Anhand der Klassifikation wird geschätzt, wie wahrscheinlich ein Datenpunkt zu einer Gruppe oder einer anderen gehört, basierend auf seiner Nähe zu anderen Datenpunkten.

Algorithmen zur Verwendung mit nicht markierten Daten umfassen folgendes:

  • Clustering-Algorithmen: Stellen Sie sich Cluster als Gruppen vor. Clustering konzentriert sich darauf, Gruppen ähnlicher Datensätze zu identifizieren und die Datensätze entsprechend der Gruppe zu kennzeichnen, zu der sie gehören. Dies geschieht ohne Vorkenntnisse über die Gruppen und deren Eigenschaften. Zu den Typen von Clustering-Algorithmen gehören K-Means-, TwoStep- und Kohonen-Clustering.
  • Assoziationsalgorithmen: Assoziationsalgorithmen finden Muster und Abhängigkeiten in Daten und identifizieren häufige „IF-THEN“-Beziehungen mit der Bezeichnung Assoziationsregeln. Diese sind mit den Regeln vergleichbar, die beim Data-Mining verwendet werden.
  • Neuronale Netze: Ein neuronales Netz ist ein Algorithmus, der ein mehrschichtiges Netz von Berechnungen mit einer Eingabeschicht definiert, in der Daten aufgenommen werden, mit mindestens einer verborgenen Schicht, in der Berechnungen durchgeführt werden, um verschiedene Schlussfolgerungen über die Eingabe zu treffen, und mit einer Ausgabeschicht, wo jeder Schlussfolgerung eine Wahrscheinlichkeit zugewiesen wird. Ein tiefes neuronales Netz definiert ein Netz mit mehreren verborgenen Schichten, von denen jede nacheinander die Ergebnisse der vorherigen Schicht präzisiert. (Weitere Informationen finden Sie im Abschnitt „Deep Learning“ weiter unten.)

Schritt 3: Trainieren des Algorithmus zur Erstellung des Modells

Das Trainieren des Algorithmus ist ein iterativer Prozess – er umfasst die Ausführung von Variablen durch den Algorithmus, den Vergleich der Ausgabe mit den produzierten Ergebnissen, die Anpassung von Gewichtungen und Verzerrungen innerhalb des Algorithmus, die zu einem genaueren Ergebnis führen könnte, und die erneute Ausführung der Variablen, bis der Algorithmus meistens das richtige Ergebnis zurückgibt. Der daraus resultierende trainierte, genaue Algorithmus ist das Modell für maschinelles Lernen – ein wichtiger Unterschied, weil „Algorithmus“ und „Modell“ fälschlicherweise synonym verwendet werden, selbst von Experten im Bereich maschinelles Lernen.

Schritt 4: Verwendung und Verbesserung des Modells 

Der letzte Schritt ist die Verwendung des Modells mit neuen Daten und im besten Fall die Verbesserung der Genauigkeit und Effektivität im Laufe der Zeit. Woher die neuen Daten stammen, hängt von dem Problem ab, das gelöst wird. Beispiel: Ein Modell für maschinelles Lernen, das darauf ausgelegt ist, Spam zu identifizieren, nimmt E-Mail-Nachrichten auf, während ein Modell für maschinelles Lernen, das einen Saugroboter steuert, Daten aufnimmt, die aus der realen Interaktion mit verschobenen Möbeln oder neuen Objekten im Raum resultieren.

Methoden für maschinelles Lernen 

Methoden für maschinelles Lernen  (auch Stile für maschinelles Lernen genannt) gliedern sich in drei Hauptkategorien.

Weitere Informationen über die Unterschiede zwischen diesen Ansätzen finden Sie unter „Überwachtes und nicht überwachtes Lernen: Was ist der Unterschied?

Überwachtes maschinelles Lernen            

Überwachtes maschinelles Lernen trainiert sich selbst mit einem markierten Datenbestand.  Das heißt, die Daten werden mit Informationen markiert, die das Modell für maschinelles Lernen bestimmen soll und die sogar in einer Weise klassifiziert sein können, in der das Modell Daten klassifizieren soll. Zum Beispiel könnte ein Computer-Vision-Modell zur Identifizierung von reinrassigen deutschen Schäferhunden mit einem Datenbestand verschiedener markierter Hundebilder trainiert werden.

Überwachtes maschinelles Lernen erfordert weniger Trainingsdaten als andere Methoden  für maschinelles Lernen und vereinfacht das Training, da die Ergebnisse des Modells mit tatsächlichen markierten Ergebnissen verglichen werden können. Jedoch sind ordnungsgemäß markierte Daten teuer in der Vorbereitung und es besteht die Gefahr der Überanpassung oder der Erstellung eines Modells, das so eng mit den Trainingsdaten verbunden und entsprechend verzerrt ist, dass es Variationen in neuen Daten nicht korrekt verarbeitet.

Weitere Informationen zu überwachtem Lernen.   

Nicht überwachtes maschinelles Lernen

Nicht überwachtes maschinelles Lernen nimmt extrem viele nicht markierte Daten auf und verwendet Algorithmen, um aussagekräftige Features zu extrahieren, die erforderlich sind, um die Daten ohne manuellen Eingriff in Echtzeit zu markieren, zu sortieren und zu klassifizieren. Bei nicht überwachtem maschinellem Lernen geht es weniger um die Automatisierung von Entscheidungen und Vorhersagen, sondern eher um die Erkennung von Mustern und Abhängigkeiten in Daten, die Menschen übersehen würden. Nehmen Sie zum Beispiel Spam-Erkennung – es werden mehr E-Mails generiert als ein Team von Datenwissenschaftlern in ihrer Lebenszeit jemals markieren oder klassifizieren könnte. Ein Algorithmus für nicht überwachtes Lernen kann riesige Mengen an E-Mails analysieren und die Features und Muster, die auf Spam hinweisen, aufdecken (und im Laufe der Zeit bei der Spam-Erkennung immer besser werden).

Weitere Informationen zu nicht überwachtem Lernen.

Halbüberwachtes Lernen 

Halbüberwachtes Lernen ist der goldene Mittelweg zwischen überwachtem und nicht überwachtem Lernen. Beim Training wird ein kleinerer Datenbestand  verwendet, um die Klassifizierung und Feature-Extraktion aus einem größeren, nicht markierten Datenbestand anzuleiten. Mit halbüberwachtem Lernen kann das Problem gelöst werden, dass es nicht genügend markierte Daten gibt (oder man es sich nicht leisten kann, genügend Daten zu markieren), um einen Algorithmus für überwachtes Lernen zu trainieren. 

Verstärkendes maschinelles Lernen

Verstärkendes maschinelles Lernen ist ein verhaltensbasiertes Modell für  maschinelles Lernen, das mit überwachtem Lernen vergleichbar ist. Der Algorithmus wird jedoch nicht mit Beispieldaten trainiert. Dieses Modell lernt mittels Versuch und Irrtum. Eine Folge erfolgreicher Ergebnisse wird verstärkt, um die beste Empfehlung oder Richtlinie für ein bestimmtes Problem zu entwickeln.

Das IBM Watson®-System, das die Jeopardy!-Challenge im Jahr 2011 gewonnen hat, ist ein gutes Beispiel dafür. Das System nutzte verstärkendes Lernen, um zu entscheiden, ob man sich an einer Antwort (oder Frage) versuchen, welches Quadrat auf der Tafel man auswählen und wie viel man wetten sollte – vor allem bei den „Daily Doubles“.

Weitere Informationen zu verstärkendem Lernen.    

Deep Learning

Deep Learning ist eine Untergruppe maschinellen Lernens (sämtliches Deep Learning ist maschinelles Lernen, aber nicht alles maschinelles Lernen ist Deep Learning). Deep-Learning-Algorithmen definieren ein künstliches neuronales Netz, das so lernt wie das menschliche Gehirn lernt. Für Deep-Learning-Modelle sind große Datenmengen erforderlich, die mehrere Schichten von Berechnungen durchlaufen, wobei in jeder aufeinanderfolgenden Schicht Gewichtungen und Verzerrungen angewendet werden, um die Ergebnisse kontinuierlich anzupassen und zu verbessern.

Deep-Learning-Modelle sind in der Regel nicht überwacht oder halbüberwacht. Verstärkende Lernmodelle können auch Deep-Learning-Modelle sein. Bestimmte Typen von Deep-Learning-Modellen – einschließlich Convolutional Neural Networks (CNNs) und Recurrent Neural Networks (RNNs) – treiben Fortschritte in Bereichen wie Computervision, Verarbeitung natürlicher Sprache (einschließlich Spracherkennung) und autonomen Autos voran. 

Lesen Sie den Blogbeitrag „KI, maschinelles Lernen, Deep Learning und neuronale Netze: Was ist der Unterschied?“, um mehr darüber zu erfahren, in welchem Zusammenhang die verschiedenen Konzepte stehen.

Weitere Informationen zu Deep Learning.                                                               

Realistische Anwendungsfälle für maschinelles Lernen

Wie zu Beginn erwähnt, sind wir von maschinellem Lernen umgeben. Hier sind nur einige Beispiele für maschinelles Lernen, denen Sie jeden Tag begegnen können:

  • Digitale Assistenten: Apple Siri, Amazon Alexa, Google Assistant und andere digitale Assistenten basieren auf der Verarbeitung natürlicher Sprache (NLP), einer Anwendung für maschinelles Lernen, die es Computern ermöglicht, Text- und Sprachdaten zu verarbeiten und die menschliche Sprache so zu „verstehen“, wie Menschen es tun. Verarbeitung natürlicher Sprache unterstützt auch sprachgesteuerte Anwendungen wie GPS- und Spracherkennungssoftware (Sprache-Text).
  • Empfehlungen:  Deep-Learning-Modelle unterstützen Empfehlungen wie „Andere Kunden mochten auch“ und „Nur für Sie“ von Amazon, Netflix, Spotify,  und anderen Services für Einzelhandel, Unterhaltung, Reisen, Jobsuche und Nachrichten.
  • Kontextbezogene Online-Werbung:  Modelle für maschinelles Lernen und Deep Learning können den Inhalt einer Webseite auswerten – nicht nur das Thema, sondern Nuancen wie die Meinung oder Einstellung des Verfassers – und auf die Interessen des Besuchers zugeschnittene Werbung bereitstellen.
  • Chatbots:  Chatbots können eine Kombination aus Mustererkennung, Verarbeitung natürlicher Sprache und tiefen neuronalen Netzen verwenden, um Eingabetext zu interpretieren und geeignete Antworten bereitzustellen.
  • Betrugserkennung:  Regressions- und Klassifizierungsmodelle für maschinelles Lernen haben regelbasierte Systeme zur Betrugserkennung ersetzt, die bei der Erkennung der Verwendung von gestohlenen Kreditkarten eine hohe Anzahl an Fehlalarmen aufweisen und bei der Ermittlung der kriminellen Nutzung von gestohlenen oder kompromittierten Finanzdaten selten erfolgreich sind.
  • Cybersicherheit: Maschinelles Lernen kann Informationen aus Vorfallsberichten, Alerts, Blogbeiträgen etc. extrahieren, um potenzielle Bedrohungen zu erkennen, Sicherheitsanalysten zu beraten und die Reaktion zu beschleunigen.
  • Analyse medizinischer Bilddaten:  Die Typen und das Volumen von Daten für die digitale Bildbearbeitung im medizinischen Bereich sind geradezu explodiert, was zu mehr verfügbaren Informationen zur Unterstützung von Diagnosen, aber auch zu mehr Möglichkeiten für menschliches Versagen beim Lesen der Daten führt. Convolutional  Neural Networks (CNNs), Recurrent Neural Networks (RNNs) und andere Deep-Learning-Modelle haben sich bei der Extraktion von Features und Informationen aus medizinischen Bilddaten als zunehmend erfolgreich erwiesen, um genaue Diagnosen zu unterstützen.
  • Autonome Autos:  Autonome Autos erfordern eine Meisterleistung maschinellen Lernens – sie müssen kontinuierlich Objekte in der Umgebung des Autos identifizieren, vorhersagen, wie diese sich ändern oder bewegen, und das Auto um die Objekte sowie zum Ziel des Fahrers leiten. Praktisch alle vorstehend genannten Algorithmen für maschinelles Lernen und Deep Learning spielen eine Rolle bei der Realisierung eines autonomen Automobils.

Maschinelles Lernen und IBM Cloud

IBM Watson Machine Learning unterstützt den gesamten Lebenszyklus von maschinellem Lernen. Die Lösung ist in einer Reihe von Angeboten verfügbar, mit denen Sie Modelle für maschinelles Lernen dort, wo sich Ihre Daten befinden, erstellen und überall in Ihrer Hybrid-Multicloud-Umgebung bereitstellen können. 

IBM Watson Machine Learning on IBM Cloud Pak for Data unterstützt Teams in den Bereichen Datenwissenschaft und KI in Unternehmen bei der Beschleunigung der standortunabhängigen Entwicklung und Bereitstellung von KI, auf einer cloudnativen Daten- und KI-Plattform. IBM Watson Machine Learning Cloud, ein Managed Service in der IBM Cloud-Umgebung, ist der schnellste Weg, um Modelle aus Versuchsreihen auf dem Desktop zur Bereitstellung für den Produktionsbetrieb zu verlagern. Für kleinere Teams mit dem Ziel, Bereitstellungen für maschinelles Lernen zu skalieren, bietet IBM Watson Machine Learning Server eine einfache Installation in jeder Private oder Public Cloud.

Melden Sie sich für eine IBMid an und erstellen Sie ein iBM Cloud-Konto, um zu beginnen.