数据识别

数据识别是查找要捕获的字段,然后将其转换为基于字符的数据的阶段。

通过识别获取的数据存储在文档组合件阶段中设置的页面数据文件中。

有多种方法可供您用于识别页面。最广泛使用的方法是指纹匹配。如果已针对页面标识使用了指纹匹配,那么使用指纹图像来定义识别专区的可能性最高。这些专区是您要在每个页面上读取的字段。如果使用完整页面识别,可以直接从完整页面识别结果获取字段数据。否则,需要在每个字段专区上运行识别引擎以捕获数据。

其他识别方法不使用指纹专区来查找字段数据。而改为使用文本匹配或图案匹配来分析页面和识别字段。