デジタル・コンテンツの爆発的な増加により、ドキュメントの形式やレイアウトのバリエーションが多種多様になり、品質や理解能力が異なる新しいインプット・チャネルが生まれました。ライドシェアの後部座席に座って、時間的制約のある駐車許可を申請するために光熱費の請求書の写真を撮影しようとしている人もいるかもしれません。あるいは、遠隔地の自宅オフィスで働きながら、患者とEメールを交換し、医療費請求を処理しようとしている場合もあるでしょう。2018年、フォーブスは過去2年間に世界のデータの90%が生成されたと述べました。2020 年にリモートワーク、遠隔医療、デジタル ソーシャル エンゲージメントなどがどれほど加速したかは想像することしかできません。
デジタル コンテンツとインプット・チャネルの爆発的な増加に加え、既存のキャプチャ テクノロジーとテクニックはもはや拡張できません。たとえば、指紋機能は、特定の文書形式や類似の種類の一致に必要な正確なデータを抽出する目的で、認識ゾーンと位置情報を指定するために使用されています。しかし、新しい社会や経済のプログラム、あるいは新しい B2B 関係から非常に多くの独自の文書形式が生まれており、これらを設定することで、ビジネスの締結、経済の改善、国民の社会福祉の向上に費やす時間が奪われてしまいます。さらに、アプリケーションのコンポーネントを識別するためのヘッダーやバーコードなどのセパレーターシートは、モバイル、Eメール、オンライン・フォームなどのさまざまなチャネルからのインプットを含む場合には効果的ではありません。
結果として、組織は文書を手動で処理するのにますます多くの時間を費やすことになりましたが、もはやファックス機の画像品質の悪さだけを責めるわけにはいきません。Levvel Researchが実施した2019年の調査では、請求書データの57%は手動で入力され、請求書の承認の49%には2~3人の承認者が必要であることがわかりました。
人工知能 (AI)は新しいものではありませんが、半構造化ドキュメントや非構造化ドキュメントの処理に組織がAIをうまく活用するのは困難でした。AIを使用するには、モデルをトレーニングするための重要なデータサイエンス・スキルと何千ものサンプル・ドキュメントが必要です。その結果、ビジネス上のメリットを実現するために文書とデータを収集する長いサイクルが発生しました。
しかし、AI の進歩とシンプルなツールにより、文書処理への利用が加速しました。まず、ディープラーニングアルゴリズムが登場し、人間の脳の思考を模倣し始めました。これらのアルゴリズムは、有効な文脈パターンを特定して、非構造化情報(文書の内容など)を理解し、その学習内容をこれまでに見たことのないものに適用します。これが転移学習と呼ばれます。これにより、文書収集プロセスと長いトレーニング・サイクルを短縮できます。第二に、シンプルなステップバイステップのガイドを備えたノーコード ツールにより、AIモデルのトレーニング、データアウトプットのフォーマットまたは変換、ビジネス リスク許容度のカスタマイズをビジネス・ユーザーは簡単に行えます。
インテリジェントな文書処理の実装やAIモデルの使用はベンダーによって異なる場合がありますが、中心となる活動は同じです。
まず、文書の分類とは、請求書や納税申告書など、文書の種類を識別する作業を指します。一連のサンプル文書を使用すると、さまざまな文書タイプと、それらの文書タイプに対応するフィールドおよび値についてAI分類モデルをトレーニングできます。このアクティビティは、データ抽出の次のアクティビティに反映されるだけでなく、他の類似した文書タイプの転移学習も可能になり、コンテンツリポジトリ内の文書の検索を向上させます。
次に、インテリジェントなデータ抽出は、重要で関連性の高い情報をページから引き出すコア・アクティビティを指します。これには、口座番号や借入金額などのキーと値のペアを識別し、データの外観とページ上の位置を定義し、さまざまなドキュメントタイプごとに関連情報に合わせてAIモデルをトレーニングすることが含まれます。このステップでは、後で検索を容易にするために、メタデータが抽出され、ドキュメントに関連付けられる場合もあります。
最後に、データアウトプットは、抽出されたデータを強化することと、下流で使用するための最終出力ファイルを作成することの両方で構成されます。AIベースのモデルを使用すると、よくあるスペルミスを自動修正したり、データを標準アウトプット形式(電話番号など)に変換したり、データの見た目に一貫性を持たせる (ドルの値の場合は小数点以下 2 桁にするなど) ことができます。最後のステップでは、アウトプットファイル (通常は JSON ファイル) を作成します。これにより、後で使用するためにワークフローにフィードしたり、コンテンツ リポジトリにプッシュしたりできます。
インテリジェントな文書処理の主なメリットは、プロセスの自動化です。これにより、検証済みの構造化データをトランザクションに組み込むことができるため、より高速な処理とスケーラブルな運用が可能になります。たとえば、ワークフロー、データ入力、データ検証の手動セットアップは、以前は人間の作業者によって何時間もかかっていたかもしれません。インテリジェントな文書処理とワークフローを統合することで、これらの手作業によるステップを排除し、データのアウトプットをビジネス・プロセスに自動的に組み込むことができます。同様に、ロボティック・プロセス・オートメーション(RPA)チャットボットに不正なデータが取り込まれると、次のステップでエラーが発生し、ビジネス プロセスのボトルネックやエラーが発生する可能性があります。インテリジェントな文書処理による継続的なアウトプットを活用することで、RPAチャットボットを組織全体にさらに簡単に拡張できます。最後に、可視化ダッシュボードにより、ビジネス・ユーザーは抽出されたデータやビジネスプロセスのボトルネックに関連するパターンや洞察を明らかにすることができ、より多くの情報に基づいた意思決定につながる可能性があります。
自動化におけるRPAの役割の詳細については、「オートメーションの技術: 第 2 章 - ロボティック プロセス オートメーション (RPA) 」を参照してください。
文書処理の自動化に対する需要があることを示す強力な証拠があります。人工知能(AI)とローコード・ツールを組み合わせることで、組織は従業員の生産性を向上させ、成果を向上させることが可能になります。
実際、IBMのお客様と協力する中で、インテリジェントな文書処理を適用できるユースケースが数多く見つかりました。以下の3つのユースケース例と、組織が実現する可能性のある潜在的なメリットについて説明します。
商業保険の見積もりと承認のプロセスは非常に競争が激しいため、最初に見積もりに対応した企業がビジネスを勝ち取ります。課題は、多くの保険会社では、このプロセスにおいて手動によるレビュー、申請データの入力、サポートするドキュメンテーションの読み取りが必要なため、競争や規模拡大が困難であることです。これにより、既存のビジネスを維持し、拡大するために必要なアドバイザリー サービスからエージェントの焦点が逸れてしまいます。インテリジェントな文書処理は、ディープラーニングを備えたAIを使用してこのプロセスを自動化し、各文書タイプを読み取って分類し、さまざまな形式から適切なデータを抽出します。抽出されたデータをワークフローに接続して、業務処理を加速して見積もりを作成し、申請を承認することができます。
インテリジェントな文書処理を適用する3つの潜在的なメリットは次のとおりです。
必要なソリューションを構築するための参考情報がITチームにないため、多数の官公庁・自治体プログラム (多数の食料補助や住宅補助金) への登録では、非効率的な手動のスプレッドシート処理が必要です。ビジネス・ユーザーは、ローコード・ツールとインテリジェントな文書処理を使用して、シンプルかつ目的に合った処理アプリケーションを構築し、登録フォームの主要なフィールドを認識できるようにシステムをトレーニングできます。さらに、簡単に設定できるバリデーターにより、日付フィールドや通貨フィールドが正確に認識されることを保証できるほか、社会保障番号などの固有のフィールドを処理するためのシンプルなカスタム バリデーターを作成することもできます。
インテリジェントな文書処理を適用する3つの潜在的なメリットは次のとおりです。
銀行のウェブサイトからダウンロードできる口座サービス フォームは20 種類以上にも及びます。口座名義人は、これらのフォームを使用して口座に変更を加えたり、口座を解約したりすることができます。現在、このような作業を行うためには、フォームを読み、データを検証し、そのデータをアカウント管理システムに入力するために、かなりの規模のエージェント・チームが必要となる場合があります。しかし、ローコード ツールとインテリジェントな文書処理を使用すると、銀行は各口座サービス フォームを処理するソリューションを迅速に構築し、インテリジェントな文書処理を使用して各フォームでシステムをトレーニングして、顧客状況や口座番号などの共通フィールドだけでなく、各フォームに固有のフィールドも認識できるようになります。
RPAと組み合わせることで、銀行は抽出されたデータを取得し、銀行のバックエンドシステムへの変更を自動化することもできます。さらに、インテリジェントな文書分類を活用することで、アカウント解約フォームに迅速にフラグを立て、潜在的な逃亡リスクの可能性があるクライアントについてエージェントに警告を発することができます。
インテリジェントな文書処理を適用する3つの潜在的なメリットは次のとおりです。
インテリジェントな文書処理に対するIBMのアプローチは、IBM Cloud Pak for Business Automationに表れています。クラウドネイティブ・ソリューションであるAutomation Document Processingは、文書からデータを自動的に読み取って修正する、一連のAI搭載型サービスです。ドキュメント処理デザイナーは、ドキュメント分類、データ抽出、データ・エンリッチメントに関するモデルをトレーニングするための、使いやすいノーコード・インターフェースを提供します。
さらに、IBMでは、1ページの文書または複数の文書の処理に使用できる文書処理アプリケーション・テンプレートも提供しています。アプリケーション・デザイナーのツールキットを使うことで、エンド・ユーザー・アプリケーションを組織内の他のアプリケーションのようにカスタマイズすることもできます。最後に、 IBMは、文書とデータアウトプットファイルの保管の両方のために、シンプルなデプロイメント ツールと、そのコンテンツ サービス機能であるIBM FileNet Content Managerとの標準統合機能を提供しています。
この章では、文書処理がいかに変化の時を迎えているか、そして文書処理の進歩においてAIが主要な役割を果たしている分野についての概要を説明しましたが、この分野では今後もさらなるイノベーションが期待されます。特に注目すべき重要な領域が 2 つあります。まず、半構造化ドキュメントと非構造化ドキュメントの形式と構造が爆発的に増加し続けているため、AIモデルもそれに追いつく必要があります。非常に複雑なテーブル構造の読み取りから、ホログラムや透かしのある行政発行のIDの処理に至るまで、AIモデルは正確さを維持することが求められます。
第二に、この分野はインテリジェントな文書処理と呼ばれていますが、動画や音声ファイルの種類は増加傾向にあります。これらのファイル タイプが保険金請求の処理や警察の事件報告書の提出に使用されるようになるのは時間の問題です。
エキサイティングな過程になることは間違いありません。
ぜひ「オートメーションの技術」ポッドキャストをご視聴ください。特に、Jerry Cuomo氏とインテリジェントな文書処理について話し合ったエピソード7は注目です。
AIとIBM Automationによりビジネスを再構築することで、ITシステムをより事前対応できるようにし、プロセスをさらに効率化して従業員の生産性を高めます。
IBMは、エクストリーム・オートメーション・コンサルティング・サービスにより、企業顧客のビジネス・トランスフォーメーションを実現します。
IBM Cloud Pak for Business Automation は、運用管理と自動化のための統合ソフトウェア・コンポーネントのモジュール式セットです。