Automation

Die Kunst der Automatisierung: Robotic Process Automation (RPA)

Veröffentliche eine Notiz:

RPA (deutsch: robotergestützte Prozessautomatisierung) setzt sich aus drei Kerntechnologien zusammen: Task-Automatisierung, Screen Recording und KI (Künstliche Intelligenz). Die Kombination dieser Technologien ermöglicht es RPA, manuelle Aufgaben produktiver zu lösen.

Von: Allen Chan, DE & CTO, Digital Business Automation, IBM

Inhalt: 

  • Eine praktische Definition von robotergestützter Prozessautomatisierung (RPA) und die drei Kerntechnologien, die sie antreiben 
  • Die vorgesehenen Nutzenden und die besten Nutzungsmöglichkeiten der Technologie 
  • Praktische Grenzen von RPA 
  • Die Rolle und Verwendung von RPA im Zusammenhang mit anderen gängigen Automatisierungstechnologien
  • Wohin geht RPA in Zukunft?

RPA: Was ist robotergestützte Prozessautomatisierung?

Man geht davon aus, dass bereits in der Vergangenheit ein großer Teil der menschlichen Aufgaben durch die Digitalisierung automatisiert wurde. Dabei übersieht man den weiterhin beachtlichen Anteil manueller und repetitiver Handlungen, die bei der Büro-Arbeit täglich anfallen. Das Kopieren von Informationen aus Excel-Tabellen in ein Formular, das Einfügen von Kundendaten oder die Eingaben bei einer Web-Bestellung – wir alle kennen viele Beispiele für derlei ermüdende manuelle Arbeitsvorgänge. Die robotergestützte Prozessautomatisierung (RPA) ist ein Weg (eigentlich ein Software-Roboter), Aufgaben dieser Art zu automatisieren, indem es die Interaktion menschlicher Benutzer*innen mit dem Computer nachahmt.


Bei der Datensachbearbeitung beispielsweise werden Eingangsrechnungen via Mail oder Fax übermittelt und verarbeitet. Ankommende Dokumente in unterschiedlichen Formaten müssen gelesen, ausgewertet und manuell in eine dafür vorgesehene Anwendung eingetragen werden. Zusätzlich kann bei Neukunden das manuelle Erstellen eines Kundenkontos anfallen. Der Einsatz eines RPA-Bots würde diese manuellen Arbeiten obsolet machen. Der Bot versteht und bewertet die Eingangsrechnungen, unter Verwendung von OCR-Techniken (Optical Character Recognition) und intelligenter Dokumentenverarbeitung. Anschließend simuliert er die Mausklicks und Tastaturanschläge, um die ausgewerteten Informationen automatisch in die vorgesehene Anwendung einzutragen. 


Es gibt einen wesentlichen Unterschied zwischen RPA und anderen Automatisierungsmethoden. RPA ist nicht auf die Kommandozeile oder API beschränkt, sondern bezieht auch die Benutzeroberfläche mit ein. Trotz der Fortschritte bei diversen Modernisierungstechniken finden immer noch viele Legacy-Geschäftsanwendungen (z.B. CICS, IMS), Anwendungslandschaften wie SAP oder native Anwendungen (z.B. auf Windows Basis) Verwendung, die keine modernen APIs oder Befehlszeilen zur Automatisierung bieten bzw. komplexe Projekte zur Automatisierung erforderlich machen. Oft haben Nutzer*innen schlicht keinen Zugriff auf APIs und diese sind zu komplex, weil die Nutzung durch Anwender kein Designkriterium war. Beispiel dafür könnten webbasierten Anwendungen von Drittanbietern, wie eine Bank-Website oder einem Online-Buchladen sein. In solchen Fällen wird RPA benötigt, um Aufgaben mit diesen Systemen zu automatisieren. 

Die drei Kerntechnologien bei RPA 

Robotergestützte Prozessautomatisierung besteht aus drei Kerntechnologien: Task-Automatisierung, Screen Recording und Künstliche Intelligenz (KI). Durch die Kombination dieser Technologien kann RPA manuelle Aufgaben am Computer viel produktiver – und damit rentabler – lösen.

Bei der Ersteinführung der RPA-Technologie herrschte der Eindruck, es handele sich nur um eine Screen-Recording-Technologie. In gewisser Weise ist das nicht falsch; RPA ist eine Weiterentwicklung von Screen Recording durch intelligentere Nutzung verschiedener Technologien wie Bildschirmassistenz, intelligenterem Parsing von UI-Daten (z. B. native Windows-Steuerelemente, Webbrowser-DOM-Modell) und einer skalierbareren Möglichkeit, viele Bots gleichzeitig zu verwalten.

Vor der massenhaften Einführung von RPA gab es drei Kategorien der Aufgaben und Prozesse: vollständig manuell, halbautomatisch menschenzentriert und vollautomatische Straight-Through-Prozesse. Das Ziel fast aller Automatisierungsprojekte ist es, den Anteil der vollständig manuellen Prozesse auf vollautomatisierte Straight-Through-Prozesse zu verlagern. Der Wunsch so viele Straight-Through-Prozesse wie möglich zu erlangen, hat die API-Wirtschaft vorangetrieben. Schließlich muss jeder Dienst über eine API zugänglich und so programmiert sein, dass alle menschlichen Eingriffe entfallen: 

Für einen problemlosen Übergang zwischen menschenzentriertem Prozess und Straight-Through-Prozess ist eine Investition notwendig. Allerdings kann diese deutlich höher ausfallen als die daraus gewonnenen Vorteile. Infolgedessen ist zu beobachten, dass viele frühe Automatisierungsprojekte auf geschäftskritische Prozesse fokussiert sind, bei denen der ROI höher ausfällt. Diese geschäftskritischen Prozesse machen oft nur 10% in einem Unternehmen aus. Die restlichen 90% sind sogenannte „Long-Tail-Prozesse“ und menschenbezogen. Dabei sind sie aber nicht bedeutend genug, um Investitionen für den Aufbau oder Bereitstellung einer API oder ein Projekt zur Prozessoptimierung zu rechtfertigen.

An dieser Stelle ist der Einsatz von RPA überzeugend und praktisch. Ohne RPA wäre es schwierig und zeitaufwändig eine Reihe von sich wiederholenden Desktop-Aufgaben ohne richtige API-Integration zu automatisieren. Die Tatsache, dass viele RPA-Lösungen (einschließlich IBM Robotic Process Automation) Low-Code-Werkzeuge in Kombination mit Screen-Recording- und Smarter-Vision-Technologie bieten, macht es für die Anwender noch einfacher und schneller, eine Lösung zu erstellen.

Daraus ergibt sich ein Mittelweg zwischen menschenzentrierten und durchgängigen Prozessen. Wir verwenden einen hybriden Ansatz mit Menschen, Bots und API, um die Automatisierung voranzutreiben:

RPA – Einsatzgebiete und Grenzen

Um herauszufinden, ob sich der Einsatz von RPA im Unternehmen lohnt, ist es ratsam sich zunächst drei Bereiche genauer anzusehen:

  • Bereiche, in denen eine mittlere bis große Anzahl von Mitarbeiter*innen größtenteils mit repetitiven und manuellen Arbeiten beschäftigt ist (z.B. Auftragsverarbeitung aus E-Mails, Datensatzabgleich zwischen Systemen usw.).
  • Systeme, die über keine APIs verfügen oder bei denen die APIs nicht zugänglich sind. Dank RPA ist eine Automatisierung trotz fehlender APIs hier nun möglich. 
  • Manuelle Schritte als Teil einer größeren Aufgabe, die im Allgemeinen als Mikro-Aufgaben bezeichnet werden. Beispielsweise müssen für einen Verkaufsbericht größere Datengruppen von verschiedenen Marketing-Websites kopiert werden. Hier kann RPA das Kopieren der Daten oder die Formatierung des Berichts routinierter und einfacher erledigen. Die Vertriebsstrategie bleibt nach wie vor der Intuition und Erfahrung eines Vertriebsleiters überlassen. 

Beaufsichtigte vs. unbeaufsichtigte RPA 

Bei RPA gibt es zwei Hauptformen von Bots: beaufsichtigte und unbeaufsichtigte. Zu Beginn der RPA-Nutzung war der Großteil „unbeaufsichtigt“. Ein unbeaufsichtigter Bot verhält sich ähnlich wie ein CronJob. In diesem Fall allerdings wurden die Bots auf einen bestimmten Computer geschickt (normalerweise einem Zeitplan folgend), um dort zu arbeiten. 

Die später eingeführten „beaufsichtigten Bots“ können bei Bedarf von den Nutzer*innen selbst auf ihrem Computer gestartet werden. In diesen Fällen automatisieren die Bots oft nicht die gesamte Aufgabe, sondern nur einen Teil davon. 

Beaufsichtigte Bots haben zwei große Hauptvorteile gegenüber den unbeaufsichtigten:

  • Beaufsichtigte Bots ermöglichen es dem Anwender, eine Teilmenge von Aufgaben eines größeren, menschengesteuerten und komplexeren Prozesses zu automatisieren. Das ist gerade dann von Vorteil, wenn eine vollständige Automatisierung schwierig wäre oder nicht das beste Ergebnis liefern würde (z.B., wenn bestimmte wissensbasierte Entscheidungen zwischen den Schritten getroffen werden müssen). 
  • Beaufsichtigte Bots ermöglichen es dem Anwender, Automatisierungen auf seinem Computer ohne Hilfe der IT-Abteilung oder zusätzliche Rechenressourcen auszuführen. 

In letzter Zeit ist ein zunehmender Trend zu beobachten, bei dem Unternehmen zusätzlich zu den traditionellen unbeaufsichtigten Bots vermehrt beaufsichtigte einsetzen. 

Wo die RPA-Technologie an ihre Grenzen stößt

  • Robotergestützte „Prozess“-Automatisierung ist eigentlich eine inkorrekte Bezeichnung. Besser würde robotergestützte „Aufgaben“-Automatisierung zutreffen. RPA ist in der Lage Aufgaben zu verselbstständigen und so Workflowteile zu automatisieren. Sie ist allerdings nicht dafür gedacht, die Arbeit über mehrere Personen oder Systeme hinweg aufeinander abzustimmen. Für diesen Zweck sollte man weiter eine Business-Process-Management-Software wie IBM Business Automation Workflow verwenden. Diese Software ist besser für komplexe Interaktion zwischen Automatisierung und Mensch geeignet und kann auch Automatisierungs-, Entscheidungs- und KI-Technologienorchestrieren. 
  • Viele Aufgaben erfordern menschliches Denken und menschliche Intuition. Hier stoßen RPA-Bots an Grenzen. Zwar nutzen sie KI, um ihre Umgebung zu verstehen. Über einfache und klar definierte Aufgaben hinauszudenken, übersteigt aber sprichwörtlich ihren Horizont. Manche RPA-Anbieter suggerieren, dass RPA alle Automatisierungsprobleme lösen kann. In der Realität mussten Kunden erkennen, dass RPA diese Erwartungen nicht erfüllt und sie einen ganzheitlichen End-to-End-Ansatz benötigen. 
  • Dort, wo eine API vorhanden ist und genutzt werden kann, ist eine API-Integration fast immer zuverlässiger und skalierbarer. Das gilt vor allem bei hohem Durchsatz und größeren Vorgängen, die auch Leistungskennzahlen und Geschäftsanalysen erfordern. 

Beispiele/Anwendungsfälle für RPA im Zusammenspiel mit anderen Automatisierungstechnologien

RPA als Teil eines übergreifenden Geschäfts- oder IT-Prozess: In diesem Fall sind die Bots ein Teil des Gesamtprozesses und arbeiten an den ihnen zugewiesenen Aufgaben. Wenn ein Bot fehlschlägt, protokolliert er einen Fehler. Die Ursachen dafür müssen häufig menschliche Mitarbeiter*innen suchen und den Rest der Aufgabe manuell erledigen. Als Teil eines übergreifenden Geschäftsprozesses kann der RPA-Bot dann jede Art Fehler an seine Teamkollegen oder den Manager delegieren oder eskalieren. 

RPA als Teil einer Integrationslösung: RPA kann Integrationsprodukte wie IBM App Connect ergänzen bzw. erweitern, indem sie eine API für Systeme bereitstellt, die keine haben. 

RPA nutzt Geschäftsregeln und KI für bessere Entscheidungen: Das Gesamtsystem wird dadurch robuster. 

RPA nutzt intelligente Dokumentverarbeitung: RPA kann mittels intelligenter Dokumentenverarbeitung unstrukturierte und halbstrukturierte Dokumente lesen. Die intelligente Dokumentenverarbeitung hat sich in den letzten Jahren erheblich weiterentwickelt. Sie kann verschiedene Dokumententypen präzise verarbeiten und lässt sich besser in andere Automatisierungswerkzeuge und Workflows integrieren. Die Automatisierung kommt damit schneller und einfacher voran.

RPA als interaktiver virtueller Agent, der die Verarbeitung natürlicher Sprache nutzt:

Die Erkennung natürlicher Sprache erweitert die Möglichkeiten der RPA. Bots können durch Sprachbefehle ausgeführt werden oder Zusatzinformationen bereitstellen. RPA lässt sich damit in bestehende Workflows integrieren und auch für nicht-technische Nutzer*innen nutzbar machen. Top-RPA-Anbieter (einschließlich IBM) betten die Sprachverarbeitung in ihre Standart-RPA-Funktion ein, ohne dass eine zusätzliche Installation erforderlich ist. 

Wie und wo künstliche Intelligenz (KI) helfen wird

RPA macht heute bereits in verschiedenen Bereichen Gebrauch von KI – hier wird es in Zukunft mehr und mehr Anwendungsfälle geben. Was RPA dabei grundsätzlich leistet, ist der Versuch, menschliches Handeln zu imitieren. 

Hier einige Beispiele: 

  • Lesen von unstrukturierten oder halbstrukturierten Dokumenten: Bei Rechnungen, gescannten Personalausweisen, handschriftliche Notizen oder E-Mails kann die RPA auf einfache Optical-Character-Recognition-Software zurückgreifen. Wirklich „smart“ wird der Bot, wenn er Inhalte extrahieren kann, beispielsweise mit IBM Automation Document Processing-Funktionen. Der Bot extrahiert dabei mittels Deep-Learning-Techniken kontextbezogene Informationen aus Rechnungen oder Ausweisen. Zum Beispiel kann er so Kundenadressen oder Artikelnummern herausfinden oder sogar Angaben korrigieren.
  • Integration mit Chat und Sprache: RPA wird typischerweise bei der Erstellung von Chat- oder Voice-Bots verwendet und in bestehende Dienste wie IBM Watson Assistant integriert. IBM Watson Assistant nutzt KI, um konkrete Empfehlungen vorzuschlagen oder um Trends und aufkommende Probleme zu erkennen. Das System lernt automatisch aus den Entscheidungen der Benutzenden, um die Interaktion stetig zu verbessern.  
  • Computer Vision: RPA erfasst die Benutzeroberfläche des Bildschirms mittels Computer Vision (z.B. Fenster, Scrollbar, Button), muss sich hier also nicht mehr auf Pixelkoordinaten stützen. Dadurch wird die Lösung flexibler, genauer und zuverlässiger und die Bots können Terminal-Server oder Citrix-Umgebungen unterstützen und auch besser auf verschiedene Geräte übertragen werden. 
  • Automatisieren von Aufgaben durch Task Mining: Die Idee hinter diesem neuen Bereich ist es, menschliche Arbeit zu beobachten, um neue Einsatzmöglichkeiten für Bots zu finden. Diese werden dann erstellt, um die Aufgaben effektiver zu bearbeiten. Dahinter steckt das Konzept der „lernenden“ Bots. Die Vorteile im Hinblick auf den ROI sind offensichtlich. IBM forscht in diesem Gebiet aktiv. 

Was kommt als nächstes in der robotergestützten Prozessautomatisierung?

Die Stärken von RPA Bots liegen im ROI der Lösung und darin, dass sie auch durch Anwender ohne technischen Hintergrund programmiert werden können. Das RPA-Konzept ist sehr leistungsfähig und bietet viel Potential für weitere Innovationen und Anwendungen. Außerdem lässt sich mit RPA eine Brücke von bestehenden Legacy-Systemen in die moderne API-Ökonomie schlagen, ohne modernisieren zu müssen. 

RPA wird sich in mehreren Bereichen weiterentwickeln: 

  • Die Bots werden intelligenter und ihr Umfeld noch besser verstehen. Sie nutzen verschiedene KI-Techniken wie natürliches Sprachverständnis, Computer Vision und Dokumentenextraktion. RPA-Bots werden also bei immer mehr Aufgaben helfen können. 
  • Jede/r Mitarbeiter*inn wird einen Bot auf seinem Desktop haben, der hilft, einen Teil der täglichen Arbeit zu automatisieren.  
  • RPA wird Teil einer umfassenden Automatisierungslösung mit engerer Integration in Workflow-Management-Systeme und Process-Mining-Software. So können mögliche Einsatzgebiete für Bots identifiziert werden. 
  • Das Erstellen von Bots wird viel einfacher werden als heute. Bessere Aufzeichnungsmöglichkeiten, verstärkter Einsatz von Computer Vision und die Nutzung von Task-Mining-Techniken werden dies unterstützen. 

Mehr erfahren

Dies ist der zweite Artikel unserer Reihe zur Kunst der Automatisierung. Den ersten Beitrag finden Sie hier.

Zusätzliche Informationen gibt es in unserer Podcast-Reihe „Die Kunst der Automatisierung. in Episode 2 unterhalten sich Arne Melcher und Sven Hapke zu Automation und RPA. Hören Sie rein!

Der Original-Artikel auf englisch ist hier erschienen

Für Fragen Steht Ihnen Sven Hapke als unser lokaler Experte zur Verfügung.

More stories
By IBM Digitale Perspektive Redaktion on November 14, 2021

Die Kunst der Automatisierung: Robotic Process Automation (RPA)

RPA (deutsch: robotergestützte Prozessautomatisierung) setzt sich aus drei Kerntechnologien zusammen: Task-Automatisierung, Screen Recording und KI (Künstliche Intelligenz). Die Kombination dieser Technologien ermöglicht es RPA, manuelle Aufgaben produktiver zu lösen. Von: Allen Chan, DE & CTO, Digital Business Automation, IBM Inhalt:  Eine praktische Definition von robotergestützter Prozessautomatisierung (RPA) und die drei Kerntechnologien, die sie antreiben  Die vorgesehenen Nutzenden […]

Weiterlesen

By Michael Mrose and Arne Melcher on August 23, 2021

Reif für die Praxis: KI-gestützte Automatisierung in Business und IT

Vor einigen Wochen hat der Bundestag ein Gesetz auf den Weg gebracht, nach dem autonome Autos der Stufe 4 ab 2022 am Straßenverkehr teilnehmen können. Stufe 4 bedeutet: Computer übernehmen vollständig die Kontrolle über das Auto, ohne von einem menschlichen Fahrer überwacht zu werden. Lange Zeit war das autonom fahrende Auto eine Vision, die allenfalls […]

Weiterlesen