随着人工智能 (AI) 的发展，好莱坞对机器人的热衷始终不减。根据同名畅销书改编的《荒野机器人》(The Wild Robot) 是 AI 电影类的最新作品之一，该片正在角逐今年的奥斯卡金像奖。
这是影视作品中为数不多的“善良”机器形象，它逐渐萌发出类人的共情能力，并悉心照料其他生灵。
电影观众可能更熟悉故事情节更为黑暗的 AI 电影。在《绝对服从》(Subservience)、《梅根》(M3gan)、《机械姬》(Ex Machina) 和 Stanley Kubrick 的经典之作《2001 太空漫游》(2001: A Space Odyssey) 中，AI 驱动的反派角色正在将我们人类逐个击破。在《我，机器人》以及《终结者》和《黑客帝国》等系列票房巨制中，智能系统处心积虑地谋划着对人类群体的奴役或灭绝。
然而，这些主题虽然有趣，但可能会削弱 AI 素养
IBM® Consulting 值得信赖的 AI 全球负责人 Phaedra Boinodiris 表示，电影制作人主要将注意力集中在一些不太合理的问题上，这些问题会将人们的注意力从现实 AI 问题上转移。
她指出，人们可能会形成"只有天网 (Skynet) 和哈尔 (HAL) 会造成威胁"的认知，此处她提及的正是《终结者》(The Terminator) 与《2001》中的经典反派形象。
这些影片以及其他电影中的系统描绘了通用人工智能 (AGI)，这是一个假想的 AI 系统，其认知能力可以媲美甚至超过人类。公众对此类科幻电影的沉迷，“最终可能导致人们对当前 AI 真实风险的理解更为匮乏。”
这些真正的风险包括有偏倚和其他有害的输出，这类输出已被归咎为对人类造成重大伤害。尽管伦理学家和开发人员付出了努力，但事实证明此类问题非常复杂且令人困惑。
例如，一项研究发现，即使生成式 AI 模型表现出较少的显性种族偏见，它们仍会表现出更隐蔽性的种族偏见。然而，预防科幻电影构想的那类生存危机挑战性会更小。
现实世界中的解决方案为当今的 AI 模型和工具提供了防护措施，或许在观众刚碰触到爆米花时，就已将好莱坞银幕上那些机器叛乱的惊险情节化解于无形。
让我们来详细了解一下。
恕我们对 James Cameron 有所不敬，但事实证明：要阻止电影人描绘的 AI 末日降临，我们并不需要手持枪械的战士。工程师和程序员使用相当普通的工具和战略就能完成这项任务，例如：
目前限制了某些城市电动滑板车行动范围的 GPS 技术，也可能有助于控制 AI机器人的出行能力。地理围栏创建了 GPS 或 RFID 设备无法跨越的虚拟边界。
在《机械姬》(Ex Machina) 与《绝对服从》(Subservience) 这类影片中，地理围栏技术本可有效阻止由 Alicia Vikander 和 Megan Fox 饰演的恶意人形机器人逃离其住所，从而瓦解她们的一些危险计划。
网络安全公司 Sophos 的高级数据科学家 Ben Gelman 解释说，机器人无法超越地理围栏的限制，因为这项技术是基于硬件的。“AI 不能编写计算机程序来改变集成电路板，”Gelman 说。“当您使用现代地理围栏时，许多机器人电影就显得近乎儿戏。”
无论面对手持枪械的终结者、暗藏剧毒的梅根，还是装备强力金属义肢的机器人，靠近杀人机器通常都不是明智之举。但是，如果可以远程停止这些机器呢？
远程终止开关便应运而生了。
IBM® Consulting 负责 AI 业务的副总裁兼高级合伙人 Shobhit Varshney 指出："如果特斯拉汽车开始驶向特定方向，总部能够远程接管控制并强制其停止。Varshney 表示，用于远程禁用电动汽车的相同技术也可以应用于失控机器人。
在机器人主动尝试阻止主角访问本地部署“关闭”按钮的电影场景中，远程禁用功能尤为宝贵。“终止开关必须是人类容易够到的，以确保人类而不是 AI 来控制系统。”
AI 灾难片的一个常见情节是，邪恶机器拥有无限的执行代码和访问各种网络资源的能力。
然而在现实中，我们拥有多重技术手段来确保 AI 模型的能力边界始终可控。例如，固定的非 AI 驱动的编程脚本可以阻止 AI 调用不在预批准列表中的功能。
或者，AI 系统可能运行在专用或隔离硬件上，而这些硬件已被阻挡访问外部系统。因此，即使它执行代码的能力不受限制，也不能接管其他系统。
例如，《终结者》(The Terminator) 中的这种保障措施可以阻止天网 (Skynet) 控制核武库。"由于系统与外界物理隔离，一旦切断这些物理系统的电源，AI 便会立即停止运行，"Gelman 解释道。
监控和管理 AI 系统越来越多地需要使用其他 AI 系统。分类模型可以检测和删除大型语言模型 (LLM) 输入和输出文本中的仇恨言论、辱骂性语言和亵渎内容。LLM 可用于验证其他同类 LLM 的输出是否符合为该系统设定的规则。
这样的验证协议本可以避免 AI 类电影中的大部分暴力场景，包括《2001》中阻止哈尔 (HAL) 惨无人道的横冲直撞，以及阻止天网 (Skynet) 消灭人类的行动。
在《我，机器人》（I, Robot）中，或许可以找到最清晰的验证用例，机器人表面上编程为遵循现实作家 Isaac Asimov 的机器人三定律。
这些定律本意是防止人类受到伤害，但在电影中，邪恶机器军团的领袖 VIKI 重新诠释了这些定律，并宣称："为了保护人类整体，部分个体必须被牺牲。"Gelman 表示，通过适当的验证，VIKI 的决定“可以很容易地进行分类和预防”。
AI 协调是指将人类价值观和目标编码到 AI 模型中的过程。实际上，它是一种内置的保障措施，可防止智能系统为追求目标而采取不道德或危险的措施，例如哈尔 (HAL) 决定处死宇航员，以确保他们的太空飞船抵达预定目的地。
值得注意的是，就目前的情况而言，AI 协调流程并非万无一失。科技新闻和分析网站 Ars Technica 的副撰稿人 Jacek Krywko 解释说："神经网络非常不擅长将抽象规则应用到具体情况和具体场景中。”
好消息是，这方面已取得进展。例如，斯坦福大学和 Meta 的研究人员创建了一个知识库，旨在为 AI 系统“奠定灵活规范推理基础”。1
知识库包含超过 150,000 个情境规范，例如，顾客在咖啡馆喝咖啡是规范的，但儿童在教室里喝咖啡则不规范。
幸运的是，如果现实世界的人工智能达到哈尔 (HAL)、VIKI 和我们在电影中看到的其他 AGI 的水平，AI 协调过程将足够先进，可以跟上发展步伐。
将 AI 的开发集中在少数几个实体手中可能会引发重大的道德问题。
“AI 发展不能由少数人控制，尤其是当其中一些人可能无法认同保护企业数据、隐私和透明度等基本价值观时，”IBM CEO Arvind Krishna 在《财富》杂志最近的一篇文章中写道。2
“解决之道不在于限制进步，而在于确保 AI 是由大学、公司、研究实验室和组织等广泛联盟共同构建的。”
在科幻小说领域，AI 开发的这种去中心化可能有助于避免《终结者》(The Terminator) 系列电影和《我，机器人》(I, Robot) 中出现的成群结队的恶意机器人造成的大规模破坏。IBM® Consulting 的 Varshney 指出，不同实体创建的 AI 可能会经历不同的现代协调流程。
如果一家公司的机器人最终出了问题，其他实体生产的机器人不会自动效仿。“其他所有系统都不会被感染。相互串通的可能性也更低，”Varshney 说道。
此外，在此类场景下，未感染的机器人能够抵御被感染的机器人，因此"不能任由某家公司的机器人强大到足以超越政府，"Varshney 说道。
有些 AI 题材的电影比其他类型的电影更容易让人信服。2013 年的电影《她》(Her) 讲述了一个男人与一个高级聊天机器人之间的浪漫故事，事实证明这部电影具有预言性。
近年来，已有大量记录在案的案例显示，人们与聊天机器人产生了情感依恋，尽管这些机器人的先进程度远不及 Scarlett Johansson 在《她》(Her) 中饰演的角色。
这部电影引发了人们对人类是否应该与 AI 建立情感依恋的质疑。多年后，麻省理工学院的研究人员着手研究了这个问题。在 2024 年的一项研究中，他们得出结论，某些聊天机器人使用模式与用户信心的提高有关，但其他模式会增加用户被孤立的风险。
研究人员认为，开发“补充而非取代人类关系”的 AI 陪伴方法具有重要价值。3但这一建议是否会受到关注，还有待观察。
至少有一部 AI 电影对现实世界的技术实践产生了重大影响。1983 年发行的《战争游戏》(War Games) 讲述了一个青少年在无意中访问了由超级计算机控制的核战争模拟后，差点引发世界大战的故事。
这部影片说服了时任美国总统 Ronald Reagan 推动制定网络安全政策，最终颁布了《电信与自动化信息系统安全国家政策》(NSSD-145)，这项具有深远影响的网络安全指令旨在保护敏感的政府网络。
不过，IBM 的 Boinodiris 表示，这部影片的意义不仅仅是对网络安全政策产生影响。这部电影提出了有关 AI 设计的哲学问题，我们整个社会仍在努力回答这些问题。
例如，当主题是战争时，AI 系统对于“获胜”应该考虑哪些因素？获胜方的死亡人数是否较少？做决策时是否应该将环境破坏作为考虑因素？那么声誉损害呢？
“开发具有此类特性的模型来做出决策时，所有这些不同类型的领域专家，包括哲学家、历史学家、心理学家，都需要参与讨论，以便能让开发出的这些模型反映我们的意图，”Boinodiris 说道。
她说，类似的挑战比屏幕上经常描绘的人形机器人混战更值得关注。对于如何缓解 AI 实际带来的意想不到的后果，“我们才刚刚起步，”Boinodiris 说。我们还有很长的路要走。”
