页面识别

页面识别是任何 Datacap应用程序中的前期步骤之一。最初为所有入局页面分配了缺省页面类型“其他”。 Datacap 必须首先确定每个页面的正确类型,然后才能将这些页面汇集到文档中并从页面中抽取数据。

页面识别包括指纹识别、基于结构的识别、文本匹配以及手动页面识别。在页面识别之前,通常会进行图像增强,以消除可能会妨碍识别过程的行、阴影和其他图形元素。