L'esplosione di contenuti digitali ha portato a così tante varianti di formati e layout dei documenti, nonché a nuovi canali di input con qualità o capacità di essere compresi vari. Potresti trovarti sul sedile posteriore di un'auto di car sharing, cercando di scattare una foto di una fattura delle utenze per richiedere un permesso di parcheggio a tempo. Oppure potresti scambiare e-mail con un paziente, cercando di elaborare una richiesta di assistenza sanitaria mentre lavori da remoto, da casa. Nel 2018, Forbes ha dichiarato che nei due anni precedenti era stato generato il 90% dei dati mondiali. Possiamo solo immaginare quanto questo sia accelerato nel 2020, tra lavoro da remoto, telemedicina, coinvolgimento social e altro ancora.
Oltre all'esplosione di contenuti digitali e canali di input, le tecnologie e le tecniche di acquisizione esistenti non possono più scalare. Ad esempio, la funzionalità delle impronte digitali è stata utilizzata per specificare le zone di riconoscimento e le informazioni sulla posizione al fine di estrarre i dati precisi necessari su specifici formati di documenti o corrispondenze di tipo simile. Tuttavia, con così tanti formati di documenti unici che emergono da nuovi programmi sociali o economici o da nuove relazioni B2B, la loro creazione richiede tempo lontano dalla chiusura delle attività, dal miglioramento dell'economia o dal progresso del benessere sociale dei cittadini. Inoltre, i fogli separatori come intestazioni o codici a barre per identificare i componenti di un'applicazione non sono efficaci quando si riceve input provenienti da canali diversi come mobile, e-mail e moduli online.
Il risultato è che le organizzazioni dedicano sempre più tempo all'elaborazione manuale dei documenti, cosa che non può essere attribuita solo alla scarsa qualità delle immagini via fax. Un sondaggio del 2019 condotto da Levvel Research ha rilevato che il 57% dei dati delle fatture viene inserito manualmente e che il 49% delle approvazioni delle fatture richiede due o tre approvatori.
Sebbene l'intelligenza artificiale (IA) non sia nuova, è stato difficile per le organizzazioni utilizzarla con successo per l'elaborazione di documenti semistrutturati e non strutturati. L'uso dell'AI ha richiesto competenze significative nella data science e migliaia di documenti di esempio per addestrare i modelli. Questo, a sua volta, ha comportato lunghi cicli di raccolta di documenti e dati al fine di ottenere un beneficio aziendale.
Tuttavia, i progressi in termini di AI e la semplicità degli strumenti sono stati in grado di accelerare l'uso per l'elaborazione dei documenti. Innanzitutto, sono emersi algoritmi di deep learning che iniziano a imitare il pensiero di un cervello umano. Questi algoritmi possono identificare modelli contestuali validi per comprendere informazioni non strutturate (come il contenuto di un documento) e applicare tale apprendimento a cose che non ha mai visto prima, il che si chiama apprendimento di trasferimento. Ciò consente di ridurre il processo di raccolta dei documenti e i lunghi cicli di formazione. In secondo luogo, gli strumenti no-code con guide dettagliate semplici consentono agli utenti business di addestrare modelli AI, formattare o convertire l'output e personalizzare la tolleranza al rischio aziendale.
Sebbene l'implementazione dell'elaborazione intelligente dei documenti e l'uso dei modelli AI possano differire a seconda del fornitore, le attività principali rimangono le stesse:
Innanzitutto, la classificazione dei documenti è l'attività con cui si identificano i tipi di documenti, come le fatture o i moduli fiscali. Utilizzando una serie di documenti di esempio, è possibile addestrare un modello di classificazione AI sui diversi tipi di documenti e sui campi e i valori che corrispondono a tali tipi di documento. Questa attività non solo alimenta la successiva attività di estrazione dei dati, ma consente anche il transfer learning per altri tipi di documenti simili e facilita una migliore ricerca di documenti all'interno dei repository di contenuti.
Successivamente, l'estrazione intelligente dei dati è l'attività principale in base alla quale le informazioni importanti e pertinenti vengono estratte dalla pagina. Consiste nell'identificare coppie di chiavi e valori come il numero di conto o l'importo dovuto, definire l'aspetto dei dati e dove potrebbero trovarsi sulla pagina e addestrare i modelli AI per le informazioni pertinenti all'interno di ciascuno dei diversi tipi di documenti. In questa fase potrebbero anche essere estratti metadati e associati al documento per facilitare la ricerca successiva.
Infine, l' output dei dati consiste sia nell'arricchimento dei dati estratti sia nella creazione del file di output finale da utilizzare a valle. I modelli basati sull'AI possono essere utilizzati per correggere automaticamente gli errori di ortografia più comuni, convertire i dati in formati di output standard (ad esempio, un numero di telefono) e formattare i dati in modo che appaiano coerenti (ad esempio, due cifre decimali per i valori in dollari). L'ultimo passaggio consiste nel creare l'output, in genere un file JSON, che può quindi alimentare un workflow o inviare a un repository di contenuti per un utilizzo successivo.
Un importante beneficiario dell'elaborazione intelligente dei documenti è l'automazione dei processi, grazie alla quale i dati strutturati già convalidati possono essere alimentati nelle transazioni, consentendo un'elaborazione più rapida e operazioni scalabili. Ad esempio, l'impostazione manuale di un workflow, l'immissione dei dati e la convalida dei dati in precedenza potevano richiedere ore da parte di un lavoratore umano. Un'integrazione tra l'elaborazione intelligente dei documenti e il workflow può eliminare questi passaggi manuali e l'output può essere inserito automaticamente in un processo aziendale. Allo stesso modo, i dati errati inseriti in un bot di Robotic Process Automation (RPA) possono comportare una fase successiva errata, che può portare a un collo di bottiglia o a un errore in un processo aziendale. Sfruttando l'output continuo dell'elaborazione intelligente dei documenti, un bot RPA può scalare più facilmente in tutta l'organizzazione. Infine, i dashboard possono consentire agli utenti business di scoprire modelli e insight relativi ai dati estratti o ai colli di bottiglia nei processi aziendali, il che può portare a un processo decisionale più informato.
Per saperne di più sul ruolo dell'RPA nell'automazione, consulta «The Art of Automation: Capitolo 2 — Robotic Process Automation (RPA)".
È evidente che esista una domanda di automazione dell'elaborazione dei documenti, per cui la combinazione dell'AI con uso limitato di codice porterà le organizzazioni a migliorare la produttività dei lavoratori e a incrementare le prestazioni aziendali.
Lavorando con i nostri clienti IBM, abbiamo scoperto una serie di casi d'uso in cui è possibile applicare l'elaborazione intelligente dei documenti. Di seguito esamineremo tre esempi di casi d'uso e i potenziali vantaggi che un'organizzazione può ottenere.
Il processo di preventivo e approvazione per le assicurazioni commerciali è molto competitivo, in cui la prima azienda a rispondere con un preventivo spesso vince il business. La sfida è che in molte compagnie assicurative questo processo richiede una revisione manuale, l'inserimento dei dati dell'applicazione e la lettura della documentazione, il che rende difficile la concorrenza o la scalabilità. Ciò distoglie anche l'attenzione degli agenti dai servizi di consulenza, necessari per mantenere e far crescere le attività esistenti. L'elaborazione intelligente dei documenti può automatizzare questo processo utilizzando AI con deep learning per leggere e classificare ogni tipo di documento ed estrarre i dati appropriati da questi diversi formati. I dati estratti possono quindi essere collegati a un workflow per accelerare l'elaborazione aziendale per produrre il preventivo e approvare l'applicazione.
Tre potenziali benefici dell'applicazione dell'elaborazione intelligente dei documenti sono i seguenti:
L'iscrizione a dozzine di programmi locali del governo, come l'assistenza alimentare o gli alloggi sovvenzionati, richiede un'elaborazione manuale inefficiente dei fogli di calcolo poiché i team IT non dispongono delle risorse per costruire le soluzioni necessarie. Utilizzando strumenti uso limitato di codice e un'elaborazione intelligente dei documenti, gli utenti business possono creare applicazioni di elaborazione semplici, ma adatte allo scopo e addestrare il sistema a riconoscere i campi chiave dei moduli di iscrizione. Inoltre, i validatori facili da configurare possono garantire che i campi data e i campi valuta siano riconosciuti con precisione e possono anche essere creati validatori semplici e personalizzati per gestire campi univoci come un numero di previdenza sociale.
Tre potenziali benefici dell'applicazione dell'elaborazione intelligente dei documenti sono i seguenti:
Le banche possono disporre di oltre 20 diversi moduli di gestione dei conti scaricabili dal proprio sito web. I titolari dei conti utilizzano questi moduli per apportare modifiche agli account o chiudere gli account. Oggi, per farlo può essere necessario un team considerevole di agenti che legga questi moduli, verificare i dati e poi li inserisca in un sistema di gestione account. Tuttavia, con uso limitato di codice e un'elaborazione intelligente dei documenti, la banca può creare rapidamente soluzioni per elaborare ogni modulo di gestione dei conti e utilizzare l'elaborazione intelligente dei documenti per addestrare il sistema su ogni modulo in modo da riconoscere non solo campi comuni come l'indirizzo del cliente e il numero di conto, ma anche campi univoci per ogni modulo.
In combinazione con l'RPA, la banca può anche prendere i dati estratti e automatizzare le modifiche nei sistemi di backend della banca. Inoltre, sfruttando la classificazione intelligente dei documenti, i moduli di chiusura degli account possono essere contrassegnati rapidamente e gli agenti avvisati dei clienti che potrebbero essere a rischio di fuga.
Tre potenziali benefici dell'applicazione dell'elaborazione intelligente dei documenti sono i seguenti:
L'approccio di IBM all'elaborazione intelligente dei documenti emerge nel nostro IBM Cloud Pak for Business Automation. Soluzione cloud-native, l'Automation Document Processing è un insieme di servizi basati su AI che leggono e correggono automaticamente i dati dai documenti. Un progettista per l'elaborazione dei documenti offre un'interfaccia no-code facile da usare per addestrare i modelli su classificazione dei documenti, estrazione dei dati e arricchimento dei dati.
Inoltre, IBM fornisce modelli di applicazioni per l'elaborazione di documenti che possono essere utilizzati per l'elaborazione di documenti a pagina singola o di batch di documenti. I toolkit in Application Designer possono essere utilizzati anche per personalizzare l'applicazione per l'utente finale in modo che assomigli ad altre applicazioni all'interno dell'organizzazione. Infine, IBM fornisce semplici strumenti di implementazione e un'integrazione pronta all'uso con le sue funzionalità di content service, IBM® FileNet Content Manager, sia per memorizzare i documenti che il file di output dei dati.
Sebbene questo capitolo abbia fornito una panoramica di come l'elaborazione dei documenti sia pronta per il cambiamento e dove AI sta giocando un ruolo importante nel progresso dell'elaborazione dei documenti, ci sono altre innovazioni in arrivo in questo settore. In particolare, ci sono due aree chiave da tenere d'occhio. Innanzitutto, poiché i formati e le strutture dei documenti semistrutturati e non strutturati continuano a esplodere, i modelli AI devono tenere il passo. Dalla lettura di strutture tabellari molto complesse all'elaborazione degli ID emessi dal governo con ologrammi o filigrane, i modelli AI saranno sfidati a rimanere precisi.
In secondo luogo, mentre questo spazio è stato coniato per l'elaborazione intelligente dei documenti, i tipi di file video e audio sono in aumento. È solo questione di tempo prima che questi tipi di file entrino nel percorso critico per l'elaborazione dei reclami assicurativi o la presentazione delle denunce di incidenti di polizia.
Continua a seguirci, sarà un viaggio emozionante.
Assicurati di dare un'occhiata al podcast The Art of Automation, in particolare all'episodio 7, in cui incontro Jerry Cuomo per parlare dell'elaborazione intelligente dei documenti.
Ripensa il tuo business con l'AI e l'automazione IBM, rendendo più proattivi i sistemi IT, più efficienti i processi e più produttive le persone.
IBM garantisce la trasformazione del business per i clienti aziendali grazie ai suoi servizi di consulenza sull'automazione.
IBM Cloud Pak for Business Automation è un set modulare di componenti software integrati per la gestione dell'esercizio dell'automazione.