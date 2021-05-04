标签
业务自动化

The Art of Automation：第 2 章 – 机器人流程自动化 (RPA)

使用笔记本电脑工作的女士

作者

Allen Chan

DE & CTO

Digital Business Automation

RPA 由三项核心技术组成：工作流自动化、屏幕抓取和 AI。 这些技术的独特组合使 RPA 能够解决人工桌面任务的生产力挑战。

本章包括：

  • 机器人流程自动化 (RPA) 的实用定义及其三大核心技术
  • RPA 的目标用户以及该技术的最佳应用场景
  • RPA 的实践局限性
  • RPA 及其作用以及与其他流行自动化技术（包括 AI）的使用
  • RPA 的下一步发展

定义机器人流程自动化

机器人流程自动化 (RPA) 是一种程序（在本例中，它是一个软件机器人），用于模仿人类用户与其桌面进行交互以执行任务。例如，将信息从 Excel 电子表格复制到表单、插入客户数据并在网站下订单等。虽然我们假设在当今的数字世界中许多人工任务已实现自动化，但我们的大部分日常工作仍然需要人工劳动，而且其中大部分工作是重复性的。

想象一下，您是一名数据文员，负责处理通过电子邮件或传真发送给您的发票。您需要阅读传入发票（可能是 PDF 文档或传真图像），然后手动将订单输入到订购应用程序中。如果是新客户下订单，您可能还需要手动创建客户账户。如果您拥有 RPA，机器人可以充分利用各种 OCR（光学字符识别）技术和智能文档处理技术来读取发票，然后模拟计算机屏幕上的鼠标点击和键盘敲击，将信息输入到订购应用程序中。

RPA 与其他自动化方法（如脚本或 API）的一个关键区别在于，RPA 不仅限于命令行或 API，还包括用户界面。尽管各种现代化技术取得了进步，但仍然有许多旧版业务应用程序（例如，CICS、IMS、SAP ）或本机应用程序（例如，基于 Windows）不提供现代化 API 或命令行来实现自动化。在某些情况下，用户根本无法访问 API（想象一下您正在使用第三方基于 Web 的应用程序，例如银行网站或在线书店），因为他们向普通用户提供后端 API 访问权限的可能性非常小。要自动执行涉及这些系统的任务，就需要 RPA。

RPA 的三大核心技术

机器人流程自动化 (RPA) 由三项核心技术组成：工作流自动化、屏幕抓取和人工智能 (AI)。正是这三种技术的独特组合，使 RPA 能够解决手动桌面任务的生产力挑战，否则这些任务的投资回报率 (ROI) 会较低。

RPA 刚推出时，人们认为它只是一种屏幕抓取技术。从某种意义上说，这并没有错；RPA 是屏幕抓取技术的演进，它更智能地利用了屏幕辅助等技术，更智能地解析了用户界面数据（例如，原生 Windows 控件、Web 浏览器 DOM 模型），并且以更具可扩展性的方式同时管理多个机器人。

在将 RPA 推向大众市场之前，大致分为三类工作流自动化：全人工、以人为中心的半自动化和全自动化直通流程。几乎所有自动化项目的目的都是将全人工流程的比例转变为全自动化直通流程。人们希望拥有尽可能多的直通流程，这也是推动 API 经济发展的原因，因为每项服务都必须可以通过 API 访问，并通过编程消除所有人工干预：

用三角形可视化自动化过程，说明从人工操作到以人为本的转型。

问题是，在以人为本的流程和直通流程之间需要进行投资，有时所需的投资可能大大超过所获得的好处。因此，我们会看到许多初始自动化项目都集中在业务关键型流程上，因为这些流程的投资回报率会更高。这些关键的业务流程通常只占公司流程的 10%，其余大部分流程是我们所说的“长尾流程”和以人为中心的流程，但它们的重要性不足以证明构建新的 API 或流程重新设计所需的投资是合理的。

这就是 RPA 技术具有吸引力和实用性的地方。RPA 擅长自动执行一系列重复性桌面任务，如果没有适当的 API 集成，这些任务的自动化将很困难且耗时。许多 RPA 解决方案（包括 IBM® Robotic Process Automation）都提供低代码创作工具，结合屏幕录制和更智能的技术，使用户能够更轻松快捷地构建解决方案。

这样做的结果是，我们在以人为本的流程和直通流程之间有一个中间地带，我们使用涉及人类、机器人和 API 的混合方法来推动自动化：

用三角形可视化自动化过程，说明从人工操作到以人为本的转型。

RPA 的预期用户和应用范围

要确定您的组织内部是否有机会使用机器人流程自动化 (RPA)，您可以首先研究以下三个方面：

  1. 拥有中型到大型人力任务工作者的领域，他们主要从事重复性的手动工作（例如，根据电子邮件处理订单、系统间的记录核对等）。

  2. 没有 API 或无法访问 API 的不同系统。通常，如果缺少 API，我们会认为这些情况无法自动化，但现在有了 RPA，就可以实现这一点。

  3. 人工步骤是更大任务的一部分。我通常将这些任务称为“微任务”。例如，作为准备销售报告的一部分，销售主管可能需要从不同的营销网站复制数据组。虽然销售战略仍然需要销售主管的直觉和经验，但使用 RPA 可以更常规地完成复制数据或设置报告格式。

有人值守与无人值守的 RPA

机器人流程自动化 (RPA) 中有两种主要形式的机器人：有人值守和无人值守。当 RPA 行业刚进入市场时，大多数机器人都是“无人值守”的。从本质上讲，无人值守机器人就像一个计划任务，只不过在这种情况下，机器人会被派往指定的计算机上运行（通常是按计划进行的）。

后来推出的“有人值守机器人”是指，用户可以在自己的电脑上按需启动的机器人。在这些情况下，机器人可能只是自动执行整体任务的一部分，而不是整个任务。

与无人值守机器人相比，有人值守机器人有以下两个主要优势：

  1. 有人值守机器人允许用户自动执行一部分任务，作为更大、更复杂的人工流程的一部分，而完全自动化可能很困难，或者无法产生最佳结果（例如，当某些基于知识的决策必须在步骤之间进行时）。

  2. 有人值守机器人允许用户在自己的计算机上运行自动化程序，而无需 IT 部门提供额外的计算资源。

最近，我们发现一个日益明显的趋势，即除了传统的无人值守机器人外，公司还在部署更多的有人值守机器人。

RPA 的局限性

  • RPA（机器人流程自动化）这个名称并不准确。它应该被称为机器人“任务”自动化。RPA 擅长自动执行任务，包含工作流自动化，但并非旨在用于编排多人或多个系统的工作。为此，人们通常会使用 IBM Business Automation Workflow 这样的业务流程管理软件，它更适合自动执行与人类之间更复杂的交互，并且可以跨多种自动化、决策和 AI 技术进行编排。

  • 还有许多任务需要人类的认知和直觉。RPA 机器人是程序，可以利用 AI 来帮助它们理解世界，但它们无法独立思考，只能完成简单且定义明确的任务。一些 RPA 供应商可能会让您相信 RPA 可以解决所有自动化问题，但实际上，客户滥用 RPA 并且无法实现期望，现在他们意识到需要针对自动化解决方案采用更全面的端到端方法。

  • RPA 并不能取代 API 集成。在拥有并且可以使用 API 的地方，使用基于 API 的集成几乎总是更可靠、更可扩展，特别是在还需要性能和业务分析的高吞吐量和大规模运营中。

将 RPA 与其他自动化技术结合使用

  • 机器人流程自动化 (RPA) 作为整体业务或 IT 流程的一部分：在这种情况下，机器人将成为整个流程的参与者，并执行分配给它们的任务。当机器人发生故障时，它会记录一个错误，而且通常需要人类操作员调查故障原因，甚至手动完成剩余的任务。通过将 RPA 作为整体业务流程的一部分，机器人可以将任何故障委派或上报给其团队成员或经理。
  • RPA 作为集成解决方案的一部分：IBM App Connect 等集成产品一起使用时，RPA 可以通过向原本没有 API 的系统提供 API 来成为整体集成流程的一部分。
  • RPA 利用商业规则和 AI 做出更好的决策：通过使用商业规则帮助其做出更好的判断，这将使整个系统更加稳健。
  • RPA 利用智能文档处理：RPA 可以使用智能文档处理来读取非结构化和半结构化文档。近年来，智能文档处理在可准确处理各种类型的文档以及如何集成到其他自动化工具和工作流方面取得了显著进步。利用 RPA 的内置功能，即智能文档处理，可以帮助您更快、更轻松地实现自动化。
  • RPA 作为交互式虚拟代理，利用自然语言处理您现在可以利用对话的力量来启动机器人或为执行机器人提供更多信息，这有助于将 RPA 集成到您现有的工作流程，使其更容易被非技术用户使用。顶级 RPA 供应商（包括 IBM）已将此功能嵌入其标准 RPA 功能，无需额外安装。

人工智能 (AI) 将如何以及在何处提供帮助

如今，机器人流程自动化 (RPA) 已在多个领域使用了 AI（并有望在未来扩展到更多用例）。从根本上说，RPA 要做的就是模仿人类执行任务时的行为。

以下是四个示例：

  1. 阅读非结构化或半结构化文档：例如，发票、扫描的身份证、手写便条或电子邮件。在这种情况下，RPA 可以使用基本的光学字符识别软件，但机器人要想变得聪明，就必须使用更先进的内容提取系统，比如 IBM Automation Document Processing 功能，它可以使用深度学习，从发票或身份证中提取上下文信息（例如，获取客户地址、物品零件编号，甚至执行信息自动更正）。

  2. 与聊天和语音集成：一个典型的示例是使用 RPA 构建聊天机器人或语音机器人，与 IBM watsonx Assistant 等现有服务集成。IBM watsonx Assistant 使用 AI 来识别和创建意图建议，发现趋势和新出现的问题，并自动从用户选择中学习以改善交互。

  3. 计算机视觉：利用计算机视觉读取屏幕，了解用户界面（如视窗、滚动条、按钮），而不是依赖传统的屏幕像素坐标。这有助于提高解决方案的准确性和可靠性，并帮助机器人更好地移植到不同的设备上。

  4. 自动执行通过任务挖掘发现的任务：这是一个相对较新的领域，其理念是通过观察人们的工作方式来识别和创建高效的机器人，也涉及到“学习型”机器人的概念。这显然是非常可取的概念，并且具有巨大的投资回报率优势。IBM 认为这是 RPA 和自动化的一个活跃研究领域。

机器人流程自动化 (RPA) 的下一步发展方向是什么？

RPA 的优势在于其清晰的投资回报率，以及日常业务用户可对其进行编程。RPA 作为一个非常强大的概念，拥有进一步创新和应用的巨大潜力。RPA 使企业能够从其旧版或现有系统过渡到更现代的 API 经济，而无需先对其平台进行现代化改造。RPA 将在以下几个领域得到发展：

  • 通过利用自然语言理解、计算机视觉、文档提取等不同的 AI 技术，机器人将变得更加智能，更好地了解世界。这使 RPA 机器人能够帮助完成更多任务。

  • 每个人的桌面上都会有一个机器人。我看到该公司在每位员工的桌面上都部署了机器人，以帮助组织中的每个人自动处理部分日常工作。

  • RPA 作为自动化的一部分，可以与工作流管理系统和流程挖掘软件更紧密地集成，以识别使用机器人的机会。

  • 创建机器人将比现在容易得多，将会有更好的记录能力，更深入地利用计算机视觉，并利用任务挖掘技术来创建机器人。

了解更多

请务必收听 The Art of Automation 播客，尤其是第 4 期，其中我与 Jerry Cuomo 坐下来讨论 RPA

《Art of Automation》播客封面