配置 OCR 使用情况

使用光学字符识别 (OCR) 从图像或 PDF 文件获取文本。 本主题介绍了受支持的 OCR 提供程序以及如何配置这些提供程序。

OCR 提供程序

Google Tesseract

Google Tesseract 是一个免费的 OCR API ,以本机方式与 IBM RPA 集成,作为识别扫描的 PDF 文件,图像和文档的选项。

您不需要其他配置即可使用 Google Tesseract。 要使用此提供程序,请在支持 OCR 的命令上选择 Google 作为 OCR 提供程序。

Abbyy

ABBYY ® FineReader® 是与 IBM RPA 集成的专有 OCR 提供程序,作为识别 PDF 文件,图像和扫描文档的选项。

您不需要其他配置即可使用 ABBYY ® FineReader®。 要使用此提供程序,请在支持 OCR 的命令上选择 ABBYY 作为 OCR 提供程序。

Google Cloud Vision

Google® Cloud Vision ® 是专有的 OCR 提供程序,您可以与 IBM RPA 集成以识别已扫描 PDF 文件,图像和文档上的文本。

需求: 要将 Google Cloud Vision 用作 IBM RPA上的 OCR 提供程序,您必须具有设置了 Cloud Vision 的 Google 帐户。 请参阅 Google的文档 🡥 ,以了解如何设置 Cloud Vision。

要生成 API 凭证 JSON 文件,请遵循 Cloud Vision 官方页面上的 逐步 🡥

要在 IBM RPA Studio的工具上使用 Google Cloud Vision:

  1. 登录到 IBM RPA Studio。
  2. 在主菜单屏幕上,访问工具选项卡。
  3. 选项 部分中,单击 选项 按钮。
  4. 单击 凭证 菜单。
  5. 单击 Google Cloud Vision 选项。
  6. 凭证 字段中,选择 API 凭证 JSON 文件的路径。
  7. 单击保存按钮。

要在自动化期间对支持 OCR 的命令使用 Google Cloud Vision:

  1. OCR 提供程序上,选择 Google Cloud Vision
  2. API 参数上,设置 API 凭证 JSON 文件的路径。