Die Kunst der Automatisierung: Kapitel 2 – Robotic Process Automation (RPA)

An einem Laptop arbeitende Frau

Autor

Allen Chan

DE & CTO

Digital Business Automation

RPA besteht aus drei Kern-Technologien: Workflow-Automatisierung, Screen Scraping und KI. Die einzigartige Kombination dieser Technologien ermöglicht es RPA, die Produktivitätsherausforderung manueller Desktop-Aufgaben zu lösen.

In diesem Kapitel wird Folgendes behandelt:

  • Eine praktische Definition von Robotic Process Automation (RPA) und den drei Kerntechnologien, die es antreiben
  • Die vorgesehenen Nutzer von RPA und die besten Einsatzmöglichkeiten der Technologie
  • Praktische Grenzen von RPA
  • RPA und seine Rolle und Anwendung mit anderen beliebten Automatisierungstechnologien, einschließlich KI
  • Die nächsten Schritte für RPA

Definition von Robotic Process Automation

Robotic Process Automation (RPA) ist ein Programm (in diesem Fall ist es ein Software-Roboter), das die Interaktion menschlicher Benutzer mit ihrem Desktop nachahmt, um Aufgaben auszuführen – zum Beispiel Informationen aus einer Excel-Tabelle in ein Formular zu kopieren, Kundendaten einzufügen und eine Bestellung auf einer Website aufzugeben usw. Auch wenn wir in der heutigen digitalen Welt davon ausgehen, dass viele menschliche Aufgaben automatisiert wurden, gibt es immer noch einen großen Teil unserer täglichen Arbeit, der manuelle Arbeit erfordert, und ein Großteil dieser Arbeit ist repetitiv.

Stellen Sie sich vor, Sie sind ein Datensachbearbeiter, der für die Bearbeitung eingehender Rechnungen verantwortlich ist, die Ihnen per E-Mail oder Fax gesendet werden. Sie müssen die Eingangsrechnung – es kann sich um ein PDF-Dokument oder ein Faxbild handeln – lesen und die Bestellung manuell in Ihre Bestellanwendung eingeben. Wenn es sich um einen neuen Kunden handelt, der die Bestellung aufgibt, müssen Sie möglicherweise auch das Kundenkonto manuell erstellen. Wenn Sie RPA haben, kann der Roboter verschiedene OCR-Techniken (Optical Character Recognition) und intelligente Dokumentenverarbeitungstechniken nutzen, um die Rechnung zu lesen und dann die Mausklicks und Tastaturanschläge auf dem Computerbildschirm zu simulieren, um die Informationen in die Bestellanwendung einzugeben.

Ein wesentlicher Unterschied zwischen RPA und anderen Automatisierungsmethoden, wie Skripten oder API, ist, dass RPA nicht auf die Befehlszeile oder API beschränkt ist, sondern auch auf die Benutzeroberflächen. Trotz der Fortschritte bei verschiedenen Modernisierungstechniken gibt es immer noch viele veraltete Geschäftsanwendungen (z. B. CICS, IMS, SAP) oder native Anwendungen (z. B. Windows-basiert), die keine modernen APIs oder Befehlszeilen zur Automatisierung bieten. In einigen Fällen hat der Benutzer einfach keinen Zugriff auf die APIs (stellen Sie sich vor, Sie verwenden eine webbasierte Anwendung eines Drittanbieters, wie z. B. eine Bankwebsite oder einen Online-Buchladen), da die Wahrscheinlichkeit, dass sie normalen Benutzern Zugriff auf ihr Backend gewähren, sehr klein ist. Um Aufgaben, die diese Systeme betreffen, zu automatisieren, benötigen Sie RPA.

Die drei Kern-Technologien in RPA

Robotic Process Automation (RPA) besteht aus drei Kern-Technologien: Workflow-Automatisierung, Screen Scraping und KI. Es ist die einzigartige Kombination dieser drei Technologien, die es RPA ermöglicht, eine Produktivitätsherausforderung bei manuellen Desktop-Aufgaben zu lösen, die sonst einen schwachen Return on Investment (ROI) hätten.

Als RPA zum ersten Mal eingeführt wurde, herrschte der Eindruck, dass es sich lediglich um eine Screen Scraping-Technologie handelte. In gewisser Weise ist das nicht falsch; RPA ist eine Weiterentwicklung des Screen Scraping mit einer intelligenteren Nutzung von Technologie wie Bildschirmunterstützung, intelligenterem Parsing von Benutzeroberflächendaten (z. B. native Windows-Steuerung, Webbrowser-DOM-Modell) und einer skalierbaren Art der gleichzeitigen Verwaltung vieler Roboter.

Vor der breiten Markteinführung von RPA gab es grob drei Kategorien der Workflow-Automatisierung: der vollständig manuelle Prozess, der halbautomatisierte, menschenzentrierte Prozess und der vollständig automatisierte Straight-Through-Prozess. Der Zweck fast aller Automatisierungsprojekte besteht darin, den Prozentsatz vollständig manueller Prozesse auf vollständig automatisierte Straight-Through-Prozesse zu verlagern. Der Wunsch, so viele Straight-Through-Prozesse wie möglich zu haben, hat dazu beigetragen, die API-Wirtschaft voranzutreiben, da jeder Service API-zugänglich und programmiert sein muss, um alle menschlichen Eingriffe zu eliminieren:

Der Automatisierungsprozess wird mit Dreiecken visualisiert, um die Transformation von manuell zu menschenzentriert zu veranschaulichen.

Das Problem besteht darin, dass zwischen einem menschenzentrierten Prozess und einem durchgetakteten Prozess eine Investition erforderlich ist, und manchmal kann die erforderliche Investition deutlich höher sein als der Nutzen, der dadurch erzielt wird. Als Ergebnis werden wir sehen, dass sich viele anfängliche Automatisierungsprojekte auf geschäftskritische Prozesse konzentrieren, bei denen der ROI höher wäre. Diese Gruppen kritischer Geschäftsprozesse machen oft nur 10 % der Prozesse im Unternehmen aus, und der Großteil der übrigen Prozesse sind sogenannte „Long-Tail-Prozesse“ und menschenzentriert, aber sie sind nicht bedeutend genug, um die Investitionen zu rechtfertigen, die für den Aufbau einer neuen API oder die Prozessneugestaltung erforderlich sind.

Hier ist der Einsatz von RPA überzeugend und praktisch. RPA ist gut in der Lage, eine Reihe sich wiederholender Desktop-Aufgaben zu automatisieren, die ohne eine ordnungsgemäße API-Integration schwierig und zeitaufwändig wären. Die Tatsache, dass viele RPA-Lösungen (einschließlich IBM Robotic Process Automation) Low-Code-Authoring-Tools in Kombination mit Bildschirmaufzeichnung und intelligenter Bildverarbeitungstechnologie bieten, macht es für Benutzer noch einfacher und schneller, die Lösung zu erstellen.

Damit wird erreicht, dass wir einen Mittelweg zwischen menschenzentrierten und Straight-Through-Prozessen haben, bei dem wir einen hybriden Ansatz verwenden, der Menschen, Roboter und API einbezieht, um die Automatisierung voranzutreiben:

Der Automatisierungsprozess wird mit Dreiecken visualisiert, um die Transformation von manuell zu menschenzentriert zu veranschaulichen.

Vorgesehene Benutzer und Grenzen von RPA

Um herauszufinden, ob es in Ihrem Unternehmen Möglichkeiten für den Einsatz von Robotic Process Automation (RPA) gibt, können Sie zunächst drei Stellen prüfen:

  1. Bereiche, in denen Sie eine mittlere bis große Anzahl menschlicher Aufgabenarbeiter haben, die größtenteils repetitive und manuelle Arbeiten ausführen (z. B. Auftragsbearbeitung per E-Mail, Datensatzabgleich zwischen Systemen usw.).

  2. Verteilte Systeme, die nicht über APIs verfügen oder bei denen APIs nicht zugänglich sind. Normalerweise hätten wir diese Situationen aufgrund fehlender APIs als nicht automatisierbar angesehen, aber mit RPA ist das jetzt möglich.

  3. Manuelle Schritte als Teil einer größeren Aufgabe. Ich bezeichne diese im Allgemeinen als Mikroaufgaben. Im Rahmen der Erstellung eines Verkaufsberichts muss der Vertriebsleiter beispielsweise möglicherweise Datengruppen von verschiedenen Marketing-Websites kopieren. Während die Verkaufsstrategie immer noch die Intuition und Erfahrung des Vertriebsmitarbeiters erfordert, kann das Kopieren der Daten oder die Formatierung des Berichts mit RPA routinemäßiger durchgeführt werden.

Beaufsichtigte vs. unbeaufsichtigte RPA

Es gibt zwei Hauptformen von Robotern in der Robotic Process Automation (RPA): beaufsichtigte und unbeaufsichtigte. Als die RPA-Branche erstmals auf dem Markt eingeführt wurde, waren die meisten Roboter „unbeaufsichtigt“. Im Wesentlichen war ein unbeaufsichtigter Bot wie ein Cronjob, nur dass in diesem Fall die Bots (in der Regel nach einem Zeitplan) auf einem bestimmten Computer ausgeführt wurden. 

„Beaufsichtigte Bots“, wie sie später eingeführt werden, sind Bots, die bei Bedarf von den Benutzern auf ihren Computern gestartet werden können. In diesen Fällen automatisieren die Bots wahrscheinlich nur einen Teil der gesamten Aufgabe und nicht die gesamte.

Im Vergleich zu unbeaufsichtigten Bots bieten beaufsichtigte Bots zwei wesentliche Vorteile:

  1. Beaufsichtigte Bots ermöglichen es Benutzern, eine Teilmenge von Aufgaben als Teil eines größeren, von Menschen gesteuerten und komplexeren Prozesses zu automatisieren, bei dem eine vollständige Automatisierung schwierig sein könnte oder nicht zum besten Ergebnis führen würde (z. B. wenn eine bestimmte wissensbasierte Entscheidungsfindung zwischen den Schritten erfolgen werden muss).

  2. Beaufsichtigte Bots ermöglichen es Benutzern, Automatisierungen auf ihren Computern auszuführen, ohne dass die IT-Abteilung zusätzliche Rechenressourcen bereitstellen muss.

In letzter Zeit beobachten wir einen zunehmenden Trend, dass Unternehmen neben den herkömmlicheren unbeaufsichtigten Bots auch mehr beaufsichtigte Bots einsetzen.

Einschränkungen von RPA

  • RPA – oder robotische „ Prozess“-Automatisierung – ist eine Fehlbezeichnung. Man hätte es robotische „Aufgaben“-Automatisierung nennen sollen. RPA eignet sich gut für die Automatisierung einer Aufgabe und beinhaltet eine Workflow-Automatisierung, ist aber nicht dafür gedacht, die Arbeit über mehrere Personen oder mehrere Systeme hinweg zu orchestrieren. In der Regel wird zu diesem Zweck eine Business Process Management-Software wie IBM Business Automation Workflow verwendet, die besser für komplexere Interaktionen zwischen Automatisierung und Menschen geeignet ist und über mehrere Automatisierungs-, Entscheidungs- und KI-Technologien hinweg orchestrieren kann.

  • Es gibt auch viele Aufgaben, die menschliche Kognition und Intuition erfordern. RPA-Bots sind Programme und können KI nutzen, um die Welt zu verstehen, aber sie können nicht über einfache und klar definierte Aufgaben hinaus denken. Einige RPA-Anbieter könnten Sie glauben machen, dass RPA alle Automatisierungsprobleme lösen kann, aber in Wirklichkeit haben Kunden RPA mit unerreichbaren Erwartungen missbraucht und erkennen nun, dass sie einen ganzheitlicheren End-to-End-Ansatz für ihre Automatisierungslösungen benötigen.

  • RPA ersetzt nicht die API-Integration. Wo Sie über eine API verfügen und diese nutzen können, ist es fast immer zuverlässiger und skalierbarer, eine API-basierte Integration zu verwenden, insbesondere bei Vorgängen mit hohem Durchsatz und in großem Umfang, bei denen auch Leistungsmetriken und Geschäftsanalysen erforderlich sind.

Nutzung von RPA zusammen mit anderen Automatisierungstechnologien

  • Robotic Process Automatisierung (RPA) als Teil eines übergreifenden Geschäfts- oder IT-Prozesses: In diesem Fall sind die Bots Teilnehmer des Gesamtprozesses und arbeiten an den ihnen zugewiesenen Aufgaben. Wenn ein Bot ausfällt, protokolliert er einen Fehler und oft müssen menschliche Bediener die Fehlergründe untersuchen oder sogar den Rest der Aufgabe manuell erledigen. Durch den Einsatz von RPA als Teil eines gesamten Geschäftsprozesses kann der Bot anschließend alle Fehler an seine Teamkollegen oder Manager delegieren oder eskalieren.
  • RPA als Teil einer Integrationslösung: Bei Verwendung zusammen mit einem Integrationsprodukt wie IBM App Connect kann RPA Teil eines gesamten Integrationsablaufs sein, indem es im Grunde eine API für Systeme bereitstellt, die sonst keine API besitzen.
  • RPA setzt Business Rules und KI ein, um bessere Entscheidungen zu treffen: Durch den Einsatz von Business Rules, die zu besseren Entscheidungen führen, wird das System insgesamt robuster.
  • RPA nutzt intelligente Dokumentenverarbeitung: RPA kann mithilfe intelligenter Dokumentenverarbeitung unstrukturierte und halbstrukturierte Dokumente lesen. Die intelligente Dokumentenverarbeitung hat sich in den letzten Jahren hinsichtlich der Vielfalt der Dokumenttypen, die sie präzise verarbeiten kann, und auch ihrer Integration in andere Automatisierungswerkzeuge und Arbeitsabläufe deutlich weiterentwickelt. Die Nutzung intelligenter Dokumentenverarbeitung als integrierte Funktion von RPA kann Ihnen helfen, Prozesse noch schneller und einfacher zu automatisieren.
  • RPA als interaktiver virtueller Agent, der die Verarbeitung natürlicher Sprache nutzt: Sie können jetzt die Leistungsfähigkeit von Konversationen nutzen, um die Ausführung von Bots zu initiieren oder zusätzliche Informationen bereitzustellen, wodurch Sie RPA in Ihre bestehenden Workflows integrieren und es für Benutzer ohne technische Kenntnisse nutzbar machen. Die führenden RPA-Anbieter (einschließlich IBM) betten diese Funktion ohne zusätzliche Installationen in ihre Standard-RPA-Funktion ein.

Wie und wo künstliche Intelligenz (KI) helfen wird

Heute gibt es mehrere Bereiche, in denen die Robotic Process Automation (RPA) KI einsetzt (mit der Erwartung, dass dies in Zukunft auf weitere Anwendungsfälle ausgeweitet werden wird). Im Grunde versucht RPA, die Handlungen des Menschen bei der Ausführung seiner Aufgaben nachzuahmen.

Hier sind vier Beispiele:

  1. Lesen von unstrukturierten oder halbstrukturierten Dokumenten: Zum Beispiel Rechnungen, gescannte Personalausweise, handschriftliche Notizen oder E-Mails. In diesen Fällen kann RPA eine einfache Software für die optische Zeichenerkennung verwenden, aber damit der Roboter intelligent ist, muss er ein fortschrittlicheres Inhaltsextraktionssystem wie die IBM Automation Document Processing-Funktionen verwenden, bei denen es Deep-Learning-Techniken einsetzt, um kontextbezogene Informationen aus Rechnungen oder Ausweisen zu extrahieren (z. B. zum Abrufen der Kundenadresse, von Artikelteilnummern oder sogar zur automatischen Korrektur von Informationen).

  2. Integration mit Chat und Sprache: Ein typisches Beispiel ist die Verwendung von RPA zur Erstellung von Chatbots oder Sprachbots – Integration mit bestehenden Diensten wie IBM watsonx Assistant. IBM watsonx Assistant nutzt KI, um Absichten zu identifizieren und zu erstellen, Trends und aufkommende Probleme zu erkennen, sobald sie auftreten, und lernt automatisch aus Benutzerentscheidungen, um Interaktionen zu verbessern.

  3. Computer Vision: Lesen des Bildschirms mit Hilfe von Computer Vision, um die Benutzeroberfläche zu verstehen (z. B. Fenster, Bildlaufleiste, Schaltfläche), anstatt sich auf die herkömmlichen Pixelkoordinaten des Bildschirms zu verlassen. Dadurch wird die Lösung genauer und zuverlässiger und Bots können auf verschiedene Geräte übertragen werden.

  4. Automatisierung von Aufgaben, die durch Task Mining entdeckt wurden: Dies ist ein relativ neuer Bereich, der mit der Idee eingeführt wurde, dass wir hocheffektive Bots identifizieren und erstellen können, indem wir beobachten, wie Menschen arbeiten. Dies fließt auch in das Konzept der „lernenden“ Bots ein. Dies ist natürlich sehr erwünscht und bringt enorme ROI-Vorteile. IBM sieht dies als aktives Forschungsgebiet für RPA und Automatisierung im Allgemeinen.

Was kommt als Nächstes bei der Robotic Process Automation (RPA)?

Die unbestreitbare Stärke von RPA liegt in einem klaren ROI und der Programmierbarkeit für alltägliche Geschäftsanwender. RPA als Konzept ist sehr leistungsfähig und birgt großes Potenzial für weitere Innovationen und Anwendungen. RPA ermöglicht es Unternehmen, eine Brücke von ihren veralteten oder bestehenden Systemen in die modernere API-Wirtschaft zu schlagen, ohne dass sie zunächst ihre Plattformen modernisieren müssen. Es gibt mehrere Bereiche, in denen sich RPA weiterentwickeln wird:

  • Durch den Einsatz verschiedener KI-Techniken wie Natural Language Understanding, Computer Vision und Dokumentenextraktion werden die Roboter intelligenter und verstehen die Welt besser. Dadurch können RPA-Bots bei mehr Aufgaben helfen.

  • Jeder wird einen Bot auf seinem Desktop haben. Ich kann mir vorstellen, dass das Unternehmen Bots auf dem Desktop jedes Mitarbeiters bereitstellt, um allen im Unternehmen zu helfen, einen Teil ihrer täglichen Arbeit zu automatisieren.

  • RPA ist Teil einer umfassenden Automatisierungslösung mit engerer Integration in Workflow-Management-Systeme und Process-Mining- Software, um Möglichkeiten für den Einsatz von Bots zu identifizieren. 

  • Die Erstellung des Bots wird viel einfacher werden als heute. Es wird bessere Aufnahmefunktionen geben, mehr intrinsischen Einsatz von Computer Vision und die Nutzung von Task-Mining-Techniken zur Erstellung von Bots.

Mehr erfahren

Das Cover des Podcasts „The Art of Automation“