关于 OCR 准确性的注意事项
在本主题中,您可以查看哪些内容会影响提供程序返回的光学字符识别 (OCR) 结果的质量。
全文搜索
全文搜索是用于补充 IBM RPA Studio OCR API 的方法。 此方法使用文本字段中的词索引来检查文档中的所有词,同时尝试匹配搜索条件。 此机制与 OCR 联合使用,大幅提高了在文档中搜索的灵活性和精确性。
影响 OCR 准确性的因素是什么?
OCR 结果并不总是可靠的,并且可以根据各种因素进行更改。 下表显示了影响 OCR 准确性的因素。
| 影响 OCR 准确性的项 | 描述 |
|---|---|
| 图像质量 | 质量较低的图像提供了不太准确的结果。 |
| 文本方向 | 水平文本输入更有可能使 OCR 提供程序将单词作为输出返回,而垂直文本使 OCR 提供程序在每一行上返回字母。 |
| 可读性 | 较小的字体大小和手写可能降低 OCR 精度。 |
| 颜色 | 在彩色和灰度图像输入之间切换可能会影响 OCR 结果。 |
| 图像背景 | 色彩背景以上的文本可能会降低 OCR 准确性。 |
| 图像分辨率 | 分辨率较低的图像会降低 OCR 准确性。 要使用 OCR 解析的图像的建议像素密度为 300 dpi。 |
| 算法版本 | 不同版本的 OCR 提供程序可能提供不同的结果,即使在扫描同一文档时也是如此。 |