Working with Watson

Das Machine Learning Tool, welches Texte versteht – Watson Knowledge Studio

Share this post:

Wenn eine Fachfrau oder ein Fachmann Hunderte von Dokumenten in einer Woche lesen kann und ein gesamtes Team aus Fachleuten Tausende, dann kann Watson – mit Hilfe von Machine Learning – Millionen lesen. Watson kann fachspezifische Literatur lesen und verstehen – Lehrbücher, Forschungsartikel, E-Mails, Blogs, was auch immer – genau wie ein Experte. Fachleute nutzen Watson als Ergänzung zu ihrem eigenen Fachwissen und können so bessere, schnellere und evidenzbasierte Entscheidungen treffen.

Das Machine Learning Tool, welches für diesen Prozess zum Einsatz kommt, ist das Watson Knowledge Studio (WKS). Dabei handelt es sich um ein leistungsstarkes Cloud-basiertes Tool, welches es Fachleuten ermöglicht mit Watson ein Machine Learning Modellen zu erstellen, das unstrukturierte Texte interpretieren und Informationen extrahieren kann. Da diese Methode zum Trainieren von Watson menschliche Anleitung erfordert, spricht man von sogenanntem überwachtem oder supervised Machine Learning.

Ein Machine Learning Modell erstellen in 4 Schritten:

  1. Definieren eines Type Systems: Die wesentlichen Bestandteile eines Type Systems sind Entity Types und Relation Types. Entity Types sind relevante Elementkategorien der Domäne, für die Watson trainiert werden soll. Diese Entities werden später in den Dokumenten markiert und somit einer Kategorie zugeordnet. Relation Types definieren, welche Beziehung zwei Entity Types zueinander haben.
  2. Hochladen domänenspezifischer Dokumente: Es ist wichtig, Dokumente auszuwählen, die für die jeweilige Domäne repräsentativ sind, da das Machine Learning Modell nur so gut sein kann, wie die für das Training zugrundeliegenden Dokumente.
  3. Annotieren der Dokumente: Anschließend wird der Text in jedem Dokument – auf Basis der zuvor definierten Entity und Relation Types – annotiert.
  4. Trainieren & Testen des Modells: Unter Performance kann das Machine Learning Modell im Anschluss trainiert und getestet werden.

Genauere Details des Machine Learning Prozesses mit dem Watson Knowledge Studio werden im Video erklärt:

Beispiele für Einsatzfelder für das Watson Knowledge Studio oder ein Machine Learning Modell sind:

  • Unfallberichte im Versicherungswesen, z.B. um die Schwere eines Unfalls, den entstandenen Schaden oder den Verursacher mit Hilfe von Machine Learning Analysen zu bestimmen.
  • Medizinischen Studien im Gesundheitswesen, z.B. um zu verstehen, was Ärzte über neue Medikamente denken oder welche Nebenwirkungen auftreten können.
  • Klageschriften in der Justiz, z.B. um den Grund der Klage zu verstehen oder um die Beteiligten zu bestimmen.
  • Alle Einsatzfelder, bei welchen eine Vielzahl an unstrukturierten Daten in Form von Text verarbeitet werden. Machine Learning Algorithmen können Muster in diesen unstrukturierten Daten erkennen und daraus ein Modell ableiten.

Das computerbasierte Verarbeiten von natürlicher Sprache in Form von Text- und Sprachdaten wird generell als Natural Language Processing (NLP) bezeichnet. Dies wurde – und wird heute immer noch – häufig regelbasiert durchgeführt. Die Herausforderung bei regelbasiertem NLP besteht darin, dass neben dem Experten mit Fachwissen zur spezifischen Domäne auch ein Experte mit Fachwissen zur Regelerstellung benötigt wird. Der große Vorteil von Machine Learning und dem Watson Knowledge Studio liegt darin, dass der Experte mit Fachwissen das Modell selbst trainieren kann, da kein komplexer Code geschrieben werden muss, um Regeln zu erstellen, sondern Dokumente relativ einfach annotiert werden können. Dadurch kann jeder ein Machine Learning Modell erstellen, welches Texte versteht.

More Working with Watson stories

Digital Bad Banks: Preparing for the Next NPL-Wave

Preparing for the Next Wave of Non-Performing Loans The Covid-19 pandemic has contributed to accelerating the shift to a new lifestyle supported by technology. The virus-lead market disruption has pressured governments to increase their balance sheets and inject unprecedented amounts of money into the economy. Despite this support, a market disruption of such magnitude will […]

Continue reading

Sustainability – The Way Forward for Banks and Regulators

The Effect of Sustainability in Banks – Management and Risk Perspective Due to new research, recent events, and increased attention from the media, awareness of various sustainability topics has increased. Recent data from the World Economic Forum shows that most adults in the world are aware of the United Nations (UN) Sustainability Development Goals (SDGs) […]

Continue reading

By Heiko Lenzing on Oktober 26, 2020

Daten sind überall. Bezwingen Sie das Chaos!

Unternehmensdaten mit IBM DataOps nutzbar machen. Eine Webinar-Reihe in 6 Folgen Unternehmen verfügen heute über umfassende Datenbestände, die es zu beherrschen gilt. Diese Daten sicher und verlässlich nutzbar zu machen, um damit Wertschöpfung zu erzielen, ist das Ziel. In dieser Webinar-Reihe zeigen wir, wie dies mit IBM DataOps Lösungen erreicht werden kann – Katalogisierung von […]

Continue reading