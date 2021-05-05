数字内容的爆炸式增长导致文档格式与版式呈现高度多样化，同时输入渠道的质量与可识别性也参差不齐。例如，用户可能身处网约车后座，为申请有时效性的停车许可而拍摄水电帐单。或者，您可能与患者进行电子邮件通信，试图在远程居家工作时处理医疗保健索赔。2018 年，福布斯指出，此前两年生成的数据量占全球数据总量的 90%。可以想象，在远程办公、远程医疗、数字社交等活动助推下，2020 年这一增长趋势更为迅猛。

除数字内容和输入渠道激增外，现有采集技术也已无法满足扩展需求。例如，指纹识别功能虽可用于指定识别区域和位置信息，以提取特定文档格式或类似匹配所需数据，但随着新社会或经济项目或新 B2B 关系带来的独特文档格式激增，配置这些功能会挤占本应用于达成交易、改善经济或推进社会福利的时间。此外，当输入来源涵盖移动端、邮件和在线表单等多渠道时，采用页眉或条形码等分隔页来识别申请组件的方法也已失效。

其结果是组织不得不投入越来越多时间进行文档人工处理，这已不能简单归咎于传真机图像质量不佳。Levvel Research 2019 年调查显示，57% 的发票数据需人工录入，49% 的发票审批需要两到三名审批人。