Deep Learning

menu icon

Deep Learning

Beim Deep Learning wird versucht, die Prozesse des menschlichen Gehirns nachzuahmen, wenngleich die Leistungsfähigkeit bei Weitem nicht dem Vorbild entspricht. So können Systeme Daten clustern und mit beeindruckender Genauigkeit Vorhersagen treffen.

Was ist Deep Learning?

Deep Learning ist eine Unterform des maschinellen Lernens und stellt im Grunde ein neuronales Netz mit mindestens drei Schichten dar. Diese neuronalen Netze versuchen, das Verhalten des menschlichen Gehirns nachzubilden, wenngleich die Leistungsfähigkeit der Technik bei Weitem nicht ihrem Vorbild entspricht. Die entsprechenden Netze können dann aus großen Mengen von Daten „lernen“. Während ein neuronales Netz mit nur einer Schicht ungefähre Vorhersagen abgeben kann, ermöglichen zusätzliche, verborgene Schichten durch Optimierung und Präzisierung mehr Genauigkeit.

Deep Learning ist die Grundlage vieler Anwendungen und Services im Bereich künstliche Intelligenz (KI), die Automation verbessern sowie analytische und physikalische Aufgaben ohne manuelles Eingreifen ausführen. Deep-Learning-Technologie findet sich in alltäglichen Produkten und Services (wie digitalen Assistenten, TV-Fernbedienungen mit Sprachsteuerung und Kreditkarten-Betrugserkennung) sowie in neuartigen Technologien (z. B. selbstfahrende Autos).

Deep Learning vs. maschinelles Lernen

Wenn Deep Learning eine Unterform des maschinellen Lernens ist, worin bestehen dann die Unterschiede? Deep Learning unterscheidet sich von klassischem Machine Learning durch die Arten von Daten, mit denen gearbeitet wird, sowie durch die Lernmethoden.

Machine-Learning-Algorithmen nutzen strukturierte, gekennzeichnete Daten, um Vorhersagen zu formulieren. Das bedeutet, dass spezifische Eigenschaften aus den Eingabedaten für das Modell definiert und in Tabellen angeordnet werden. Das bedeutet nicht unbedingt, dass unstrukturierte Daten keine Verwendung finden. Es heißt nur, dass sie gegebenenfalls vorverarbeitet werden, um in einem strukturierten Format angeordnet zu werden.

Deep Learning macht einen Teil der Vorverarbeitung von Daten, die üblicherweise zu maschinellem Lernen dazugehört, überflüssig. Diese Algorithmen können unstrukturierte Daten wie Text und Bilder aufnehmen und verarbeiten.  Gleichzeitig wird die Extraktion von Eigenschaften automatisiert, sodass weniger menschliche Experten nötig sind. Nehmen wir beispielsweise eine Reihe von Fotos unterschiedlicher Tiere, die den Kategorien Katze, Hund, Hamster usw. zugeordnet werden sollen. Deep-Learning-Algorithmen können entscheiden, welche Eigenschaften (z. B. Ohren) am wichtigsten sind, um ein Tier vom anderen zu unterscheiden. Beim maschinellen Lernen wird diese Hierarchie der Eigenschaften manuell von einem menschlichen Expertenteam definiert.

Durch die Prozesse des Gradientenverfahrens und der Backpropagation passt sich der Deep-Learning-Algorithmus an. So können bei einem neuen Tierfoto immer genauere Vorhersagen getroffen werden.  

Zudem unterscheiden sich die Lernarten von Machine-Learning- und Deep-Learning-Modellen, die sich üblicherweise in überwachtes Lernen, nicht überwachtes Lernen und Verstärkungslernen unterteilen lassen. Überwachtes Lernen nutzt gekennzeichnete Datensätze zum Kategorisieren oder Treffen von Vorhersagen. Dabei ist in irgendeiner Form manuelles Eingreifen erforderlich, um die Eingabedaten korrekt zu kennzeichnen. Nicht überwachtes Lernen hingegen erfordert keine gekennzeichneten Datensätze. Stattdessen werden Muster in den Daten erkannt und diese nach Unterscheidungsmerkmalen in Cluster eingeteilt. Beim Verstärkungslernen lernt das Modell beim Ausführen einer Aktion in einer auf Rückmeldung basierenden Umgebung, immer genauer zu werden, um „belohnt“ zu werden.

Um sich genauer mit den Unterschieden zwischen den verschiedenen Technologien zu beschäftigen, lesen Sie „KI vs. maschinelles Lernen vs. Deep Learning vs. neuronale Netze: Wo liegen die Unterschiede?

Mehr über die spezifischen Unterschiede zwischen überwachtem und nicht überwachtem Lernen erfahren Sie in „Überwachtes vs. nicht überwachtes Lernen: Wo liegen die Unterschiede?“

So funktioniert Deep Learning

Neuronale Deep-Learning-Netze, oder künstliche neuronale Netze, versuchen, die Prozesse im menschlichen Gehirn durch eine Kombination von Dateneingaben, -gewichtungen und -verzerrungen nachzuempfinden. Das Zusammenspiel dieser Elemente soll Objekte innerhalb der Daten präzise erkennen, klassifizieren und beschreiben.

Diese neuronalen Netze bestehen aus mehreren Schichten miteinander verbundener Knoten, die jeweils auf der vorherigen Schicht aufbauen, um die Vorhersage oder Kategorisierung zu präzisieren und zu optimieren. Dieser Verlauf von Berechnungen durch das Netz nennt sich Forwardpropagation. Die Ein- und Ausgabeschichten diese neuronalen Deep-Learning-Netze werden sichtbare  Schichten genannt. In der Eingabeschicht nimmt das Deep-Learning-Modell die zu verarbeitenden Daten auf. In der Ausgabeschicht erfolgt die endgültige Vorhersage oder Klassifizierung.

Ein weiterer Prozess namens Backpropagation nutzt Algorithmen wie das  Gradientenverfahren, um Fehler in den Vorhersagen zu berechnen. Dann werden die Gewichtungen und Verzerrungen der Funktion rückwirkend durch die Schichten angepasst, um das Modell zu trainieren. Mit Forward- und Backpropagation können neuronale Netze Vorhersagen treffen und Fehler entsprechend korrigieren. Im Laufe der Zeit wird der Algorithmus sukzessive präziser.

Diese Beschreibung bezieht sich auf die einfachste Art eines neuronalen Deep-Learning-Netzes in einfachen Worten. Deep-Learning-Algorithmen sind jedoch ungeheuer komplex und es gibt verschiedene Arten neuronaler Netze zum Umgang mit spezifischen Problemen oder Datensätzen. Einige Beispiele:

  • Convolutional Neural Networks (CNNs), die primär bei Bildverarbeitungs- und Bildklassifizierungsanwendungen zum Einsatz kommen, können Eigenschaften und Muster in einem Bild erkennen und so Aufgaben wie Objekterkennung ermöglichen. Im Jahr 2015 übertraf ein CNN zum ersten Mal einen Menschen bei einer Objekterkennungsaufgabe.
  • Recurrent Neural Networks (RNNs) kommen üblicherweise bei Anwendungen im Bereich Spracherkennung zum Einsatz, da sequenzielle oder Zeitreihendaten genutzt werden.

Deep-Learning-Anwendungen

Deep-Learning-Anwendungen finden sich überall in unserem Alltag, sind aber meist so gut in Produkte und Services integriert, dass man sich der komplexen Datenverarbeitung im Hintergrund gar nicht bewusst ist. Einige Beispiele:

Strafverfolgung

Deep-Learning-Algorithmen können Transaktionsdaten analysieren und von ihnen lernen, um Gefahrenmuster zu erkennen, die auf mögliche Betrugsversuche oder Straftaten hinweisen können. Spracherkennung, Computer Vision und andere Deep-Learning-Anwendungen machen Ermittlungsarbeiten effizienter und wirksamer: Muster und Beweise werden aus Ton- und Videoaufnahmen, Bildern und Dokumenten extrahiert, um große Datenmengen schneller und präziser zu analysieren.

Finanzdienstleistungen

Finanzinstitute nutzen regelmäßig Vorhersageanalysen, um den algorithmischen Aktienhandel zu steuern, Geschäftsrisiken für Darlehensbewilligungen zu beurteilen, Betrug zu erkennen sowie Kredit- und Anlageportfolios für Kunden zu verwalten.

Kundenservice

Viele Unternehmen beziehen Deep-Learning-Technologie in ihre Kundenserviceprozesse mit ein. Chatbots sind als einfache Form der KI Bestandteil vieler Anwendungen, Dienstleistungen und Kundenserviceportale. Herkömmliche Chatbots nutzen natürliche Spracherkennung und auch visuelle Erkennung, wie sie häufig in den Menüs von Callcentern zu finden sind. Es gibt jedoch auch hochentwickelte Chatbot-Lösungen, die durch Lernprozesse herausfinden wollen, ob es mehrere Antworten auf unklare Fragen gibt. Basierend auf den Antworten, die er erhält, versucht der Chatbot dann, die Fragen direkt zu beantworten oder das Gespräch an einen menschlichen Benutzer weiterzuleiten.

Virtuelle Assistenten wie Siri von Apple, Alexa von Amazon oder Google Assistant erweitern das Konzept eines Chatbots um die Funktion der Spracherkennung. Dadurch entsteht eine neue Methode, um mit Benutzern auf personalisierte Weise zu interagieren.

Gesundheitswesen

Seit der Digitalisierung von Krankenhausdaten und -bildern profitiert die Gesundheitsbranche in hohem Maß von Deep Learning. Anwendungen zur Bilderkennung können Fachkräften der medizinischen Bildverarbeitung und der Radiologie helfen, mehr Bilder in kürzerer Zeit zu analysieren und zu beurteilen.

Hardwarevoraussetzungen für Deep Learning

Deep Learning erfordert enorme Rechenleistung. Leistungsstarke Grafikprozessoren sind ideal, weil sie in mehreren Kernen mit reichlich Speicherplatz ein großes Volumen an Berechnungen bewältigen. Die Verwaltung mehrerer lokal installierter Grafikprozessoren kann viele interne Ressourcen binden und kostenintensiv bei der der Skalierung sein.

Deep Learning und IBM

Seit Jahrzehnten gilt IBM als Pionier bei der Entwicklung von KI-Technologien und Deep Learning, was sich auch bei der Entwicklung von IBM Watson, dem KI-Chatbot von IBM, zeigt. Als einer der ersten Erfolge im Bereich Deep Learning hat sich Watson zu einer verlässlichen Lösung für Unternehmen entwickelt, die eine erweiterte Verarbeitung natürlicher Sprache und Machine-Learning-Techniken in ihren Systemen umsetzen wollen und sich dabei für einen bewährten, mehrstufigen Ansatz der KI-Einführung und -Implementierung entschieden haben.

Watson nutzt das Unstructured Information Management Architecture (UIMA) von Apache und DeepQA-Software von IBM, um Anwendungen um leistungsstarke Deep-Learning-Fähigkeiten zu ergänzen. Mit Tools wie IBM Watson Studio kann Ihr Unternehmen seine Big Data nutzen, Datenwissenschaftsprojekte live schalten und Modelle in jeder Cloud bereitstellen und ausführen.

Weitere Informationen zu Ihrer Einführung von Deep-Learning-Technologie finden Sie in IBM Watson Studio.

Melden Sie sich für eine IBMid an und erstellen Sie Ihr IBM Cloud-Konto.