Maschinelles Lernen

menu icon

Maschinelles Lernen

Diese Einführung in das maschinelle Lernen gibt einen Überblick über seine Geschichte, wichtige Definitionen, Anwendungen und Anliegen in heutigen Unternehmen.

Was ist maschinelles Lernen?

Maschinelles Lernen ist ein Zweig der künstlichen Intelligenz (KI) und Computerwissenschaft, der sich auf die Verwendung von Daten und Algorithmen konzentriert, um die Art und Weise, wie Menschen lernen, zu imitieren und die Genauigkeit schrittweise zu verbessern.

Die Geschichte von IBM auf dem Gebiet des maschinellen Lernens ist sehr umfangreich. Einer von ihnen, Arthur Samuel, hat mit seinen Forschungen (PDF, 481 KB) (Link befindet sich außerhalb von IBM) rund um das Spiel Dame den Begriff „maschinelles Lernen“ geprägt. Robert Nealey, selbsternannter Meister des Spiels Dame, spielte 1962 das Spiel auf einem IBM 7094 Computer und verlor gegen den Computer. Im Vergleich zu dem, was heute möglich ist, erscheint diese Leistung fast trivial, aber sie gilt als ein großer Meilenstein im Bereich der künstlichen Intelligenz. In den nächsten Jahrzehnten werden die technologischen Entwicklungen rund um Speicher- und Rechenleistung einige innovative Produkte ermöglichen, die wir heute kennen und lieben, wie etwa die Empfehlungsmaschine von Netflix oder selbstfahrende Autos.

Maschinelles Lernen ist ein wichtiger Bestandteil des wachsenden Feldes der Datenwissenschaft. Durch die Anwendung statistischer Methoden werden Algorithmen geschult, um Klassifikationen oder Vorhersagen zu machen und wichtige Erkenntnisse innerhalb von Data-Mining-Projekten aufzudecken. Diese Erkenntnisse treiben die Entscheidungsfindung innerhalb von Anwendungen und Unternehmen voran und wirken sich im Idealfall auf wichtige Wachstumsmetriken aus. Mit dem weiteren Wachstum von Big Data wird die Nachfrage nach Datenwissenschaftlern steigen, die bei der Identifizierung der relevantesten Geschäftsfragen und anschließend der Daten zur Beantwortung dieser Fragen helfen sollen.

Maschinelles Lernen vs. Deep Learning vs. Neurale Netzwerke

Da Deep Learning und maschinelles Lernen tendenziell austauschbar genutzt werden, lohnt es sich, die Nuancen zwischen den beiden zu beachten. Maschinelles Lernen, Deep Learning und neuronale Netze sind alle Teilfelder der künstlichen Intelligenz. Deep Learning ist jedoch eigentlich ein Teilgebiet des maschinellen Lernens, und neuronale Netze sind ein Teilgebiet des Deep Learning.

Der Unterschied zwischen Deep Learning und maschinellem Lernen liegt in der Art und Weise, wie jeder Algorithmus lernt. Deep Learning automatisiert einen Großteil der Merkmalsextraktion, wodurch ein Teil der erforderlichen manuellen Eingriffe entfällt und die Verwendung größerer Datensätze ermöglicht wird. Man kann sich Deep Learning als „skalierbares maschinelles Lernen“ vorstellen, wie Lex Fridman in diesem MIT-Vortrag (00:30) anmerkt (Link befindet sich außerhalb von IBM). Klassisches oder „nicht tiefes“ maschinelles Lernen ist mehr auf menschliche Eingriffe zum Lernen angewiesen. Menschliche Experten bestimmen den Satz von Merkmalen, um die Unterschiede zwischen den Dateneingaben zu verstehen, was normalerweise mehr strukturierte Daten zum Lernen erfordert.

Beim Einsatz von markierten Datensätze kann „tiefes“ maschinelles Lernen, auch bekannt als überwachtes Lernen, seinen Algorithmus informieren, aber ein markierter Datensatz ist nicht unbedingt benötigt. Es kann unstrukturierte Daten in ihrer Rohform (z. B. Text, Bilder) aufnehmen und automatisch die Menge der Merkmale bestimmen, die verschiedene Datenkategorien voneinander unterscheiden. Im Gegensatz zum maschinellen Lernen ist kein menschlicher Eingriff zur Verarbeitung der Daten erforderlich, wodurch wir das maschinelle Lernen auf interessantere Weise skalieren können. Deep Learning und neuronale Netze werden vor allem für die Beschleunigung des Fortschritts in Bereichen wie Computervision, Verarbeitung natürlicher Sprache und Spracherkennung geschätzt.

Neuronale Netze, oder künstliche neuronale Netze (artificial neural networks, ANNs), bestehen aus einer Knotenschicht, die eine Eingabeschicht, eine oder mehrere verdeckte Schichten und eine Ausgabeschicht enthält. Jeder Knoten, bzw. jedes künstliche Neuron, ist mit einem anderen verbunden und hat ein zugehöriges Gewicht und einen Schwellenwert. Wenn die Ausgabe eines einzelnen Knotens über dem festgelegten Schwellenwert liegt, wird dieser Knoten aktiviert und sendet Daten an die nächste Schicht des Netzes. Ansonsten werden keine Daten an die nächste Schicht des Netzes weitergegeben. Die „Tiefe“ im Deep Learning bezieht sich nur auf die Tiefe der Schichten in einem neuronalen Netz. Ein neuronales Netz, das aus mehr als drei Schichten besteht — einschließlich der Eingänge und der Ausgabe — kann als tiefer Lernalgorithmus oder als tiefes neuronales Netz betrachtet werden. Ein neuronales Netz, das nur zwei oder drei Schichten hat, ist nur ein grundlegendes neuronales Netz.

Lesen Sie den Blogbeitrag „KI, maschinelles Lernen, Deep Learning und neuronale Netze: Was ist der Unterschied?“, um mehr darüber zu erfahren, in welchem Zusammenhang die verschiedenen Konzepte stehen.

So funktioniert maschinelles Lernen

UC Berkeley (Link befindet sich außerhalb von IBM) unterteilt das Lernsystem eines maschinellen Lernalgorithmus in drei Hauptteile.

  1. Ein Entscheidungsprozess: In der Regel werden maschinelle Lernalgorithmen verwendet, um eine Vorhersage oder Klassifikation zu erstellen. Basierend auf einigen Eingabedaten, die ohne oder mit Kennzeichnung sein können, erstellt Ihr Algorithmus eine Schätzung zu einem Muster in den Daten.
  2. Eine Fehlerfunktion: Eine Fehlerfunktion dient dazu, die Vorhersage des Modells zu bewerten. Wenn es bekannte Beispiele gibt, kann eine Fehlerfunktion einen Vergleich vornehmen, um die Genauigkeit des Modells zu bewerten.
  3. Ein Modelloptimierungsprozess: Wenn das Modell besser an die Datenpunkte im Trainingsset angepasst werden kann, werden die Gewichtungen angepasst, um die Diskrepanz zwischen dem bekannten Beispiel und der Modellschätzung zu verringern. Der Algorithmus wiederholt diesen Bewertungs- und Optimierungsprozess und aktualisiert die Gewichte autonom, bis ein Schwellenwert für die Genauigkeit erreicht ist.

Methoden des maschinellen Lernens

Klassifikatoren des maschinellen Lernens fallen in drei Hauptkategorien.

Überwachtes maschinelles Lernen

Überwachtes Lernen, auch bekannt als überwachtes maschinelles Lernen, wird durch die Verwendung von gekennzeichneten Datensätzen definiert, um Algorithmen zu trainieren, die Daten klassifizieren oder Ergebnisse präzise vorhersagen können. Während Eingabedaten in das Modell eingespeist werden, passt es seine Gewichtungen an, bis das Modell angemessen angepasst ist. Dies geschieht als Teil des Kreuzvalidierungsprozesses, um sicherzustellen, dass das Modell nicht über- oder unterangepasst wird. Überwachtes Lernen hilft Unternehmen, eine Vielzahl von realen Problemen in großem Umfang zu lösen, wie z. B. die Klassifizierung von Spam in einen separaten Ordner vom Posteingang. Einige Methoden, die beim überwachten Lernen verwendet werden, sind neuronale Netze, Naive Bayes, lineare Regression, logistische Regression, Random Forest, Support Vector Machine (SVM) und mehr.

Nicht überwachtes maschinelles Lernen

Unüberwachtes Lernen, auch als nicht überwachtes maschinelles Lernen bezeichnet, verwendet maschinelle Lernalgorithmen um Datensätze ohne Kennzeichnung zu analysieren und zu clustern. Diese Algorithmen entdecken verdeckte Muster oder Datengruppierungen, ohne dass ein manueller Eingriff erforderlich ist. Die Fähigkeit, Ähnlichkeiten und Unterschiede in Informationen zu entdecken, macht es zur idealen Lösung für explorative Datenanalysen, Cross-Selling-Strategien, Kundensegmentierung, Bild- und Mustererkennung. Es wird auch verwendet, um die Anzahl der Merkmale in einem Modell durch den Prozess der Dimensionalitätsreduktion zu reduzieren; Hauptkomponentenanalyse (principal component analysis, PCA) und Singulärwertzerlegung (singular value decomposition, SVD) sind zwei gängige Ansätze hierfür. Andere Algorithmen, die beim nicht überwachten Lernen verwendet werden, sind z. B. neuronale Netze, K-Means Clustering, probabilistische Clustering-Methoden und mehr.

Halbüberwachtes Lernen

Halbüberwachtes Lernen ist der goldene Mittelweg zwischen überwachtem und nicht überwachtem Lernen. Während des Trainings wird es ein kleinerer Datensatz mit Kennzeichnung verwendet, um die Klassifizierung und Merkmalsextraktion aus einem größeren Datensatz ohne Kennzeichnung anzuleiten. Mit halbüberwachtem Lernen kann das Problem gelöst werden, dass es nicht genügend markierte Daten gibt (oder man es sich nicht leisten kann, genügend Daten zu markieren), um einen Algorithmus für überwachtes Lernen zu trainieren.

Weitere Informationen über die Unterschiede zwischen diesen Ansätzen finden Sie unter „Überwachtes und nicht überwachtes Lernen: Was ist der Unterschied?

Verstärkendes maschinelles Lernen

Verstärkendes maschinelles Lernen ist ein verhaltensbasiertes Modell für maschinelles Lernen, das dem überwachten Lernen ähnelt, aber der Algorithmus wird nicht mit Stichprobendaten trainiert. Dieses Modell lernt mittels Versuch und Irrtum. Eine Folge erfolgreicher Ergebnisse wird verstärkt, um die beste Empfehlung oder Richtlinie für ein bestimmtes Problem zu entwickeln.

Das IBM Watson®-System, das die Jeopardy!-Challenge im Jahr 2011 gewonnen hat, ist ein gutes Beispiel dafür. Das System nutzte verstärkendes Lernen, um zu entscheiden, ob man sich an einer Antwort (oder Frage) versuchen, welches Quadrat auf der Tafel man auswählen und wie viel man wetten sollte – vor allem bei den „Daily Doubles“.

Erfahren Sie mehr über verstärkendes Lernen.

Realistische Anwendungsfälle für maschinelles Lernen

Hier sind nur einige Beispiele für maschinelles Lernen, denen Sie jeden Tag begegnen können:

Spracherkennung: Es wird auch als automatische Spracherkennung (automatic speech recognition, ASR), Computer-Spracherkennung oder Sprache-zu-Text bezeichnet und ist eine Fähigkeit, die die Verarbeitung natürlicher Sprache (natural language processing, NLP) nutzt, um menschliche Sprache in ein schriftliches Format zu verarbeiten. Viele mobile Geräte integrieren Spracherkennung in ihre Systeme, um Sprachansagen durchzuführen — z. B. Siri — oder um mehr Barrierefreiheit rund um das Thema Schreiben von Texten zu bieten.

Kundendienst: Online-Chatbots ersetzen menschliche Agenten entlang der Customer Journey. Sie beantworten häufig gestellte Fragen (FAQs) zu Themen wie Versand oder bieten personalisierte Beratung, Cross-Selling von Produkten oder Größenvorschläge für Benutzer und verändern damit die Art und Weise, wie wir über Kundeninteraktion auf Websites und Social-Media-Plattformen denken. Beispiele sind Messaging-Bots auf E-Commerce-Seiten mit virtuellen Agenten, Messaging-Apps wie Slack und Facebook Messenger sowie Aufgaben, die üblicherweise von virtuellen Assistenten und Sprachassistenten übernommen werden.

Computervision: Diese KI-Technologie ermöglicht es Computern und Systemen, aus digitalen Bildern, Videos und anderen visuellen Eingaben sinnvolle Informationen abzuleiten und auf Basis dieser Eingaben Maßnahmen zu ergreifen. Diese Fähigkeit, Empfehlungen zu geben, unterscheidet sie von Bilderkennungsaufgaben. Angetrieben durch Convolutional Neural Networks findet die Computer Vision Anwendung beim Foto-Tagging in Social Media, bei der radiologischen Bildgebung im Gesundheitswesen und bei selbstfahrenden Autos in der Automobilindustrie.

Empfehlungs-Engines: Anhand von Daten zum vergangenen Konsumverhalten können KI-Algorithmen helfen, Datentrends zu entdecken, die zur Entwicklung effektiverer Cross-Selling-Strategien genutzt werden können. Dies wird verwendet, um dem Kunden während des Check-out-Vorgangs bei Online-Händlern relevante Add-on-Empfehlungen zu geben.

Automatisierter Aktienhandel: KI-gesteuerte Hochfrequenzhandelsplattformen, die zur Optimierung von Aktienportfolios entwickelt wurden, führen täglich Tausende oder sogar Millionen von Handelsaktivitäten voll automatisch aus.

Herausforderungen des maschinellen Lernens

Die fortschreitende Technologie des maschinellen Lernens hat unser Leben sicherlich einfacher gemacht. Die Umsetzung von maschinellem Lernen in Unternehmen hat jedoch auch eine Reihe von ethischen Bedenken in Bezug auf KI-Technologien aufgeworfen. Einige dieser schließen ein:

Technologische Singularität

Während dieses Thema in der Öffentlichkeit viel Aufmerksamkeit erregt, sind viele Forscher nicht besorgt über die Vorstellung, dass KI die menschliche Intelligenz in naher oder unmittelbarer Zukunft übertreffen wird. Dies wird auch als Superintelligenz bezeichnet, die Nick Bostrum definiert als „jeder Intellekt, der die besten menschlichen Gehirne in praktisch jedem Bereich bei weitem übertrifft, einschließlich wissenschaftlicher Kreativität, allgemeiner Weisheit und sozialer Fähigkeiten.“ Trotz der Tatsache, dass starke KI und Superintelligenz in der Gesellschaft nicht unmittelbar bevorstehen, wirft die Vorstellung davon einige interessante Fragen auf, wenn wir den Einsatz von autonomen Systemen wie selbstfahrenden Autos in Betracht ziehen. Es ist unrealistisch zu glauben, dass ein fahrerloses Auto niemals in einen Autounfall verwickelt werden würde, aber wer ist unter diesen Umständen verantwortlich und haftbar? Sollten wir autonome Fahrzeuge noch weiter vorantreiben, oder beschränken wir die Integration dieser Technologie, um nur halbautonome Fahrzeuge zu schaffen, die die Sicherheit der Fahrer erhöhen? Die Jury ist sich noch nicht einig, aber dies sind die Arten von ethischen Debatten, die mit der Entwicklung neuer, innovativer KI-Technologie auftreten.

Auswirkungen von KI auf Arbeitsplätze:

Während sich ein Großteil der öffentlichen Wahrnehmung rund um die künstliche Intelligenz um den Verlust von Arbeitsplätzen dreht, sollte diese Sorge wahrscheinlich anders formuliert werden. Mit jeder disruptiven, neuen Technologie sehen wir, dass sich die Marktnachfrage nach bestimmten Jobrollen verschiebt. Wenn wir uns zum Beispiel die Automobilindustrie ansehen, so verlagern viele Hersteller, wie GM, ihren Schwerpunkt auf die Produktion von Elektrofahrzeugen, um sich auf grüne Initiativen auszurichten. Die Energiewirtschaft wird nicht verschwinden, aber die Energiequelle verlagert sich von der Kraftstoff- zur Elektroindustrie. Künstliche Intelligenz sollte in ähnlicher Weise betrachtet werden, wo künstliche Intelligenz die Nachfrage von Arbeitsplätzen in andere Bereiche verlagern wird. Es wird Personen geben müssen, die bei der Verwaltung dieser Systeme helfen, da die Daten täglich wachsen und sich ändern. Es werden immer noch Ressourcen benötigt, um komplexere Probleme in den Branchen anzugehen, die am ehesten von der Verschiebung der Arbeitsnachfrage betroffen sind, wie z. B. der Kundendienst. Der wichtige Aspekt der künstlichen Intelligenz und ihrer Auswirkung auf den Arbeitsmarkt wird darin bestehen, den Menschen beim Übergang in diese neuen Bereiche der Marktnachfrage zu helfen.

Datenschutz:

Der Datenschutz wird meist im Zusammenhang mit dem Datenschutz und der Datensicherheit diskutiert, und die Gesetzgeber haben hier in den letzten Jahren größere Fortschritte gemacht. So wurde 2016 die DSGVO-Gesetzgebung geschaffen, um die persönlichen Daten von Personen in der Europäischen Union und dem Europäischen Wirtschaftsraum zu schützen und dem Einzelnen mehr Kontrolle über seine Daten zu geben. In den Vereinigten Staaten entwickeln einzelne Bundesstaaten Richtlinien, wie z. B. den California Consumer Privacy Act (CCPA), die Unternehmen dazu verpflichten, Verbraucher über die Sammlung ihrer Daten zu informieren. Diese neue Gesetzgebung hat Unternehmen dazu gezwungen, die Art und Weise, wie sie persönlich identifizierbare Daten (personally identifiable data, PII) speichern und verwenden, zu überdenken. Infolgedessen haben Investitionen in die Sicherheit für Unternehmen zunehmend Priorität, da sie versuchen, Schwachstellen und Möglichkeiten für die Überwachung, Hackerangriffe und Cyberattacken zu beseitigen.

Vorurteile und Diskriminierung:

Fälle von Vorurteilen und Diskriminierung bei einer Reihe von intelligenten Systemen haben viele ethische Fragen in Bezug auf den Einsatz von künstlicher Intelligenz aufgeworfen. Wie können wir gegen Vorurteile und Diskriminierung absichern, wenn die Trainingsdaten selbst zu Verzerrungen neigen können? Während Unternehmen in der Regel wohlmeinende Absichten in Bezug auf ihre Automatisierungsbemühungen haben, hebt Reuters (Link befindet sich außerhalb von IBM) einige der unvorhergesehenen Folgen der Integration von KI in Einstellungspraktiken hervor. In ihrem Bemühen, einen Prozess zu automatisieren und zu vereinfachen, hat Amazon unbeabsichtigt potenzielle Bewerber für offene technische Positionen nach Geschlecht unterschieden und musste das Projekt schließlich verwerfen. Während Ereignisse wie diese auftauchen, hat die Harvard Business Review (Link befindet sich außerhalb von IBM) weitere pointierte Fragen rund um den Einsatz von KI in der Einstellungspraxis aufgeworfen, z. B. welche Daten man bei der Bewertung eines Kandidaten für eine Rolle verwenden sollte.

Voreingenommenheit und Diskriminierung sind auch nicht auf die Personalabteilung beschränkt; sie finden sich in einer Reihe von Anwendungen von Gesichtserkennungssoftware bis hin zu Algorithmen für Social Media.

In dem Maße, in dem sich Unternehmen der Risiken von KI bewusst werden, wird auch die Diskussion um Ethik und Werte von KI aktiver geführt. Zum Beispiel teilte IBMs CEO Arvind Krishna letztes Jahr mit, dass IBM allgemeine Gesichtserkennungs- und Analyseprodukte eingestellt hat und betonte, dass „IBM den Einsatz jeglicher Technologie ablehnt, einschließlich der von anderen Anbietern angebotenen Gesichtserkennungstechnologie, für Massenüberwachung, rassistische Profilerstellung, Verletzungen grundlegender Menschenrechte und Freiheiten oder jeglichen Zweck, der nicht mit unseren Werten und Prinzipien des Vertrauens und der Transparenz übereinstimmt und wird ihn nicht dulden.“

Um mehr darüber zu erfahren, lesen Sie den Policy Blog von IBM, der seinen Standpunkt zum Thema „Ein präziser Regulierungsansatz zur Kontrolle des Exports von Gesichtserkennungstechnologie“ weitergibt.

Rechenschaftspflicht

Da es keine nennenswerte gesetzliche Vorschriften zur Regulierung von KI-Praktiken gibt, besteht kein wirklicher Durchsetzungsmechanismus, der sicherstellt, dass ethische KI praktiziert wird. Die aktuellen Anreize für Unternehmen, sich an diese Richtlinien zu halten, sind die negativen Auswirkungen eines unethischen KI-Systems auf das Geschäftsergebnis. Um diese Lücke zu schließen, sind in Zusammenarbeit von Ethikern und Forschern ethische Rahmenwerke entstanden, die die Konstruktion und Verbreitung von KI-Modellen in der Gesellschaft regeln sollen. Zurzeit dienen diese jedoch nur als Leitfaden und Untersuchungen (Link befindet sich außerhalb von IBM) (PDF, 984 KB) zeigen, dass die Kombination aus verteilter Verantwortung und mangelnder Voraussicht möglicher Folgen nicht unbedingt dazu beiträgt, Schaden für die Gesellschaft zu verhindern.

Weitere Informationen zu IBM Position rund um KI Ethik finden Sie hier.

Maschinelles Lernen und IBM Cloud

IBM Watson Machine Learning unterstützt den gesamten Lebenszyklus von maschinellem Lernen. Die Lösung ist in einer Reihe von Angeboten verfügbar, mit denen Sie Modelle für maschinelles Lernen dort, wo sich Ihre Daten befinden, erstellen und überall in Ihrer Hybrid-Multicloud-Umgebung bereitstellen können.

IBM Watson Machine Learning on IBM Cloud Pak for Data unterstützt Teams in den Bereichen Datenwissenschaft und KI in Unternehmen bei der Beschleunigung der standortunabhängigen Entwicklung und Bereitstellung von KI, auf einer cloudnativen Daten- und KI-Plattform. IBM Watson Machine Learning Cloud, ein Managed Service in der IBM Cloud-Umgebung, ist der schnellste Weg, um Modelle aus Versuchsreihen auf dem Desktop zur Bereitstellung für den Produktionsbetrieb zu verlagern. Für kleinere Teams mit dem Ziel, Bereitstellungen für maschinelles Lernen zu skalieren, bietet IBM Watson Machine Learning Server eine einfache Installation in jeder Private oder Public Cloud.

Melden Sie sich für eine IBMid an und richten Sie ein IBM Cloud-Account ein, um zu starten.