Die Explosion digitaler Inhalte hat zu zahlreichen Variationen von Dokumentenformaten und -layouts sowie zu neuen Eingaben mit unterschiedlicher Qualität oder Verständlichkeit geführt. Man könnte zum Beispiel auf dem Rücksitz einer Fahrgemeinschaft sitzen und versuchen, eine Betriebskostenabrechnung zu fotografieren, um eine zeitkritische Parkerlaubnis zu beantragen. Oder man tauscht E-Mails mit einem Patienten aus und versucht, einen Gesundheitsanspruch zu bearbeiten, während er von zu Hause aus arbeitet. Im Jahr 2018 gab Forbes an, dass in den beiden Jahren zuvor 90 % der Daten weltweit generiert worden waren. Man kann sich nur vorstellen, wie sehr sich dies im Jahr 2020 zwischen Remote-Arbeit, Telemedizin, digitalen sozialen Engagements und mehr beschleunigt hat.
Neben der explosionsartigen Zunahme digitaler Inhalte und Eingabekanälen sind auch vorhandene Technologie und -techniken nicht mehr skalierbar. So wurde beispielsweise die Fingerabdruckfunktionalität verwendet, um Erkennungszonen und Positionsinformationen festzulegen, um genau die Daten zu extrahieren, die für bestimmte Dokumentenformate oder Übereinstimmungen ähnlicher Art benötigt werden. Bei so vielen einzigartigen Dokumentenformaten, die aus neuen sozialen oder wirtschaftlichen Programmen oder neuen B2B-Beziehungen hervorgehen, nimmt die Einrichtung dieser jedoch Zeit in Anspruch, um entweder Geschäfte abzuschließen, die Wirtschaft zu verbessern oder das soziale Wohlergehen der Bürger zu fördern. Außerdem sind Trennblätter wie Kopfzeilen oder Barcodes zur Identifizierung von Komponenten einer Anwendung nicht effektiv, wenn die Eingaben über verschiedene Kanäle wie Mobilgeräte, E-Mail- und Online-Formulare stammen.
Das Ergebnis ist, dass Unternehmen immer mehr Zeit mit der manuellen Bearbeitung von Dokumenten verbringen, wofür wir nicht einfach die schlechte Bildqualität des Faxgeräts verantwortlich machen können. Eine von Levvel Forschung durchgeführte Umfrage aus dem Jahr 2019 ergab, dass 57 % der Rechnungsdaten manuell eingegeben werden und 49 % der Rechnungsgenehmigungen zwei bis drei Genehmiger erforderlich waren.
Künstliche Intelligenz (KI) ist zwar nicht neu, aber für Unternehmen bisher schwierig für die Verarbeitung halbstrukturierter und unstrukturierter Dokumente einzusetzen. Der Einsatz von KI erforderte umfangreiche Data-Science-Kenntnisse und Tausende von Beispieldokumenten zum Trainieren von Modellen. Dies wiederum hat zu langen Zyklen bei der Erfassung von Dokumenten und Daten geführt, um geschäftliche Nutzen zu erzielen.
Fortschritte in der KI und einfache Tools haben jedoch den Einsatz von KI in der Dokumentenverarbeitung beschleunigen können. Zum einen sind Deep-Learning-Algorithmen entstanden, die das Denken eines menschlichen Gehirns nachahmen. Diese Algorithmen können gültige kontextuelle Muster identifizieren, um unstrukturierte Informationen (wie den Inhalt eines Dokuments) zu verstehen, und dieses Lernen auf Dinge anwenden, die sie bisher noch nicht gesehen haben – was als Transferlernen bezeichnet wird. Dies trägt dazu bei, den Dokumentenerfassungsprozess und lange Schulungszyklen zu reduzieren. Zweitens machen es No-Code-Tools mit einfachen Schritt-für-Schritt-Anleitungen für Geschäftsanwender leicht, KI-Modelle zu trainieren, Ausgaben zu formatieren oder zu konvertieren und die Risikotoleranz des Unternehmens anzupassen.
Auch wenn sich die Implementierung der intelligenten Dokumentenverarbeitung und die Nutzung von KI-Modellen je nach Anbieter unterscheiden kann, bleiben die Kernaktivitäten dieselben:
Erstens ist die Dokumentenklassifizierung die Aufgabe, mit der Sie Dokumenttypen wie Rechnungen oder Steuerformulare identifizieren. Anhand einer Reihe von Beispieldokumenten kann ein KI-Klassifizierungsmodell auf die verschiedenen Dokumenttypen sowie die Felder und Werte, die diesen Dokumenttypen entsprechen, trainieren. Diese Aktivität fließt nicht nur in die nächste Aktivität der Datenextraktion ein, sondern ermöglicht auch das Transferlernen für andere, ähnliche Dokumenttypen und erleichtert die Suche nach Dokumenten in Inhalts-Repositories.
Als Nächstes steht die intelligente Datenextraktion im Mittelpunkt, bei der wichtige, relevante Informationen aus der Seite gezogen werden. Diese besteht aus der Identifizierung von Schlüssel- und Wertpaaren wie einer Kontonummer oder einem geschuldeten Betrag, der Definition, wie die Daten aussehen sollten und wo sie sich auf der Seite befinden könnten, und dem Training der KI-Modelle für die relevanten Informationen in den einzelnen Dokumenttypen. In diesem Schritt können auch Metadaten extrahiert und mit dem Dokument verknüpft werden, um die spätere Suche zu erleichtern.
Die Datenausgabe schließlich besteht sowohl aus der Anreicherung der extrahierten Daten als auch aus der Erstellung der endgültigen Ausgabedatei für die nachgelagerte Verwendung. KI-basierte Modelle können verwendet werden, um häufige Rechtschreibfehler automatisch zu korrigieren, Daten in Standardausgabeformate umzuwandeln (z. B. eine Telefonnummer) und Daten so zu formatieren, dass sie einheitlich aussehen (z. B. zwei Dezimalstellen für Dollarbeträge). Der letzte Schritt besteht in der Erstellung der Ausgabedatei – in der Regel eine JSON-Datei –, die dann in einen Workflow eingespeist oder zur späteren Verwendung in ein Content-Repository übertragen wird.
Ein Hauptvorteil der intelligenten Dokumentenverarbeitung ist die Automatisierung, bei der bereits validierte strukturierte Daten in Transaktionen eingespeist werden können, was eine schnellere Verarbeitung und skalierbare Abläufe ermöglicht. So konnte beispielsweise die manuelle Einrichtung eines Workflows, die Dateneingabe und die Datenvalidierung durch einen menschlichen Mitarbeiter bisher Stunden dauern. Durch eine Integration zwischen intelligenter Dokumentenverarbeitung und Workflow können diese manuellen Schritte eliminiert werden, und die Datenausgabe kann automatisch in einen Geschäftsprozess eingespeist werden. Ebenso können schlechte Daten, die in einen Robotic Process Automation (RPA)-Bot eingespeist werden, zu einem fehlerhaften nächsten Schritt führen, was entweder zu einem Engpass oder zu einem Fehler in einem Geschäftsprozess führen kann. Durch die Nutzung der kontinuierlichen Ausgabe aus der intelligenten Dokumentenverarbeitung kann ein Bot leichter in einem Unternehmen skaliert werden. Schließlich können Dashboards Geschäftsanwendern die Möglichkeit geben, Muster und Erkenntnisse in Bezug auf extrahierte Daten oder Engpässe in Geschäftsprozessen zu erkennen, was zu einer fundierteren Entscheidungsfindung führen kann.
Mehr erfahren Sie zur Rolle von RPA in der Automatisierung unter „Die Kunst der Automatisierung: Kapitel 2 — Robotic Process Automation (RPA).”
Es gibt starke Beweise dafür, dass eine Nachfrage nach automatisierter Dokumentenverarbeitung besteht, wobei die Kombination von künstlicher Intelligenz (KI) und Low-Code-Tools dazu führen wird, dass Unternehmen die Produktivität ihrer Mitarbeiter verbessern und die Unternehmensleistung steigern werden.
In der Tat haben wir bei der Zusammenarbeit mit unseren eigenen IBM Kunden eine Reihe von Anwendungsfall entdeckt, bei denen die intelligente Dokumentenverarbeitung eingesetzt werden kann. Im Folgenden werden drei Anwendungsfallbeispiele und die potenziellen Vorteile, die ein Unternehmen erzielen kann, durchgegangen.
Das Angebots- und Genehmigungsverfahren für gewerbliche Versicherungen ist sehr wettbewerbsintensiv, wobei das erste Unternehmen, das mit einem Angebot antwortet, oft den Zuschlag erhält. Die Herausforderung besteht darin, dass dieser Prozess in vielen Versicherungsunternehmen eine manuelle Überprüfung, Eingabe von Anwendungsdaten und das Lesen von Dokumentation erfordert, was es schwierig macht, wettbewerbsfähig zu bleiben oder zu skalieren. Dies lenkt auch den Fokus der Agenten von den Beratungsdiensten ab, die erforderlich sind, um das bestehende Geschäft zu halten und auszubauen. Die intelligente Dokumentenverarbeitung kann diesen Prozess mithilfe von KI mit Deep Learning automatisieren, um jeden Dokumenttyp zu lesen und zu klassifizieren und die entsprechenden Daten aus diesen verschiedenen Formaten zu extrahieren. Die extrahierten Daten können dann mit einem Workflow verbunden werden, um die Geschäftsabläufe für die Erstellung des Angebots und die Genehmigung der Anwendung zu beschleunigen.
Drei potenzielle Nutzen der Anwendung intelligenter Dokumentenverarbeitung sind:
Die Anmeldung für Dutzende von Regierungsprogrammen der Regierung – wie Lebensmittelhilfe oder subventionierter Wohnraum – erfordert eine ineffiziente, manuelle Spreadsheet-Verarbeitung, da die IT-Teams keine Ressourcen haben, um die erforderlichen Lösungen zu entwickeln. Mit Hilfe von Low-Code-Tools und intelligenter Dokumentenverarbeitung können Geschäftsanwender einfache, aber zweckmäßige Verarbeitungsanwendungen erstellen und das System darauf schulen, die Schlüsselfelder der Registrierungsformulare zu erkennen. Darüber hinaus können einfach zu konfigurierende Prüfer sicherstellen, dass Datums- und Währungsfelder korrekt erkannt werden. Einfache, benutzerdefinierte Prüfer können auch erstellt werden, um eindeutige Felder wie eine Sozialversicherungsnummer zu verarbeiten.
Drei potenzielle Nutzen der Anwendung intelligenter Dokumentenverarbeitung sind:
Banken können über 20 verschiedene Kontoführungsformulare zum Download auf ihrer Website zur Verfügung stellen. Kontoinhaber verwenden diese Formulare, um Änderungen an Konten vorzunehmen oder Konten zu schließen. Heute kann dafür ein großes Team von Bearbeitern erforderlich sein, um diese Formulare zu lesen, die Daten zu Verify und die Daten dann in ein Account-Management-System einzugeben. Mit Low-Code-Tools und intelligenter Dokumentenverarbeitung kann die Bank jedoch schnell Lösungen entwickeln, um jedes Kontobetreuungsformular zu verarbeiten und das System mit intelligenter Dokumentenverarbeitung auf jedem Formular zu schulen, damit es nicht nur gängige Felder wie Adresse und Kontonummer erkennt, sondern auch eindeutige Felder für jedes Formular.
Durch die Kombination mit RPA kann die Bank auch die extrahierten Daten übernehmen und die Änderungen in den Backend-Systemen der Bank automatisieren. Darüber hinaus können durch die intelligente Dokumentenklassifizierung Kontoabschlussformulare schnell gekennzeichnet und Agenten auf Kunden aufmerksam gemacht werden, die potenzielle Fluchtrisiken darstellen könnten.
Drei potenzielle Nutzen der Anwendung intelligenter Dokumentenverarbeitung sind:
Der Ansatz von IBM bezüglich intelligenter Dokumentenverarbeitungsoberflächen in unserem IBM® Cloud Pak for Business Automation. Automation Document Processing ist eine cloudnative Lösung und besteht aus einer Reihe von KI-gestützten Diensten, die Daten aus Dokumenten automatisch auslesen und korrigieren. Ein Dokumentenverarbeitungsdesigner bietet eine benutzerfreundliche No-Code-Schnittstelle für das Trainieren von Modellen zur Dokumentenklassifizierung, Datenextraktion und Datenanreicherung.
Darüber hinaus bietet IBM Anwendungsvorlagen zur Dokumentverarbeitung, die für die Verarbeitung von Dokumenten oder Dokumentenstapeln verwendet werden können. Toolkits im Application Designer können auch verwendet werden, um die Endbenutzer-Anwendung so anzupassen, dass sie wie andere Anwendungen in einem Unternehmen aussieht und sich auch so anfühlt. Schließlich bietet IBM einfache Bereitstellungstools und eine sofort einsatzbereite Integration mit seinen Content-Services-Funktionen, IBM FileNet Content Manager, sowohl für das Speichern der Dokumente als auch für die Ausgabedatei.
In diesem Kapitel wurde ein Überblick darüber gegeben, inwiefern die Dokumentenverarbeitung reif für Veränderungen ist und wo KI eine wichtige Rolle bei der Weiterentwicklung der Dokumentenverarbeitung spielt. In diesem Bereich gibt es jedoch noch mehr Innovation. Es gibt vor allem zwei Schlüsselbereiche, die man im Auge behalten sollte. Erstens müssen KI-Modelle mit der Entwicklung von Formaten und Strukturen halbstrukturierter und unstrukturierter Dokumente fortfahren. Vom Lesen hochkomplexer Tabellenstrukturen bis hin zur Verarbeitung von Regierungs-ausgestellten Ausweisen mit Hologrammen oder Wasserzeichen werden KI-Modelle vor der Herausforderung stehen, genau zu bleiben.
Zweitens: Während dieser Bereich als intelligente Dokumentenverarbeitung bezeichnet wurde, sind Video- und Audiodateien auf dem Vormarsch. Es ist nur eine Frage der Zeit, bis diese Dateitypen für die Bearbeitung von Versicherungsansprüchen oder die Einreichung von polizeilichen Zwischenfallmeldungen kritisch sind.
Bleiben Sie dabei, es wird sicher spannend.
Schauen Sie sich unbedingt den Podcast „The Art of Automation“ an, insbesondere die siebte Folge, in der ich mich mit Jerry Cuomo zusammensetze, um über die intelligente Dokumentenverarbeitung zu sprechen.
Denken Sie Ihr Unternehmen mit KI und IBM Automation neu. Diese tragen dazu bei, IT-Systeme proaktiver, Prozesse effizienter und Mitarbeitende produktiver zu machen.
IBM gewährleistet mit seinen Beratungsdiensten für extreme Automatisierung die Unternehmenstransformation für Unternehmenskunden.
IBM Cloud Pak for Business Automation ist ein modularer Satz integrierter Softwarekomponenten für das Betriebsmanagement und die Automatisierung.