通过示例为通用人工智能做好准备

戴眼镜学习笔记的人

作者

Tim Mucci

IBM Writer

Gather

Cole Stryker

Staff Editor, AI Models

IBM Think

想象一下这样一个世界:机器不局限于预编程的任务,而是以类似人类的自主性和能力运行。在这样一个世界里,计算机思维可以驾驶自动驾驶汽车、深入研究复杂的科学研究、提供个性化的客户服务,甚至深入了解未知领域。

这就是通用人工智能 (AGI) 的潜力所在,这项假想的科技可能会彻底改变人类生活和工作的方方面面。虽然 AGI 仍停留在理论阶段,组织可以采取积极措施,通过建立强大的数据基础设施和营造人类与 AI 无缝协作的环境,为 AGI 的到来做好准备。

AGI,有时被称为强 AI,是人工智能 (AI) 的科幻版本,其中机器人工智能实现了人类水平的学习、感知和认知灵活性。但是,与人类不同的是,AGI 不会感到疲劳或有生物需求,并且可以以难以想象的速度不断学习和处理信息。随着机器智能继续承担曾经被认为是人类智能和认知能力的专属任务,开发出能够学习和解决复杂问题的人工思维的前景有望彻底改变和颠覆许多行业。

想象一辆由 AGI 驾驶的自动驾驶汽车。它不仅可以从机场接到乘客并在不熟悉的道路上行驶,还可以实时调整其对话。它可能会回答有关当地文化和地理的问题,甚至根据乘客的兴趣进行个性化设置。它可能会根据偏好和当前的受欢迎程度推荐一家餐厅。如果乘客以前乘坐过该 AGI 驾驶的汽车,那么 AGI 可以利用过去的对话进一步个性化体验,甚至推荐他们在上次旅程中喜欢的东西。

LaMDA 和 GPT-3 等 AI 系统擅长生成人类质量的文本、完成特定任务、根据需要翻译语言以及创建不同类型的创意内容。虽然这些大型语言模型 (LLM) 技术有时看起来像是科幻小说所承诺的思考机器,但重要的是要明白它们并不是。

实现这些壮举是通过结合复杂的算法、自然语言处理(NLP) 和计算机科学原理来实现的。像 ChatGPT 这样的 LLM 会经过大量文本数据的训练,使它们能够识别语言中的模式和统计关系。NLP 技术帮助他们解析人类语言的细微差别,包括语法、句法和上下文。通过使用复杂的 AI 算法和计算机科学方法,这些 AI 系统可以生成类似人类的文本,以令人印象深刻的准确性翻译语言,并生成模仿不同风格的创意内容。

当今的 AI,包括生成式 AI,通常被称为狭义 AI。它擅长筛选海量数据集,以识别模式、将自动化应用于工作流,并生成人类质量的文本。然而,这些系统缺乏真正的理解,并且无法适应训练之外的情况。这种差距凸显了当前 AI 与 AGI 潜力之间的巨大差异。

虽然取得的进步令人振奋,但从弱 AI 到真正 AGI 的飞跃是一项重大挑战。研究人员正在深入了解机器中的人工意识、一般问题解决和常识推理。虽然开发真正的 AGI 的时间表仍不确定,但组织现在可以通过构建坚实的数据优先基础设施来做好技术基础设施准备,以应对未来的进步。

组织如何为 AGI 做好准备?

AGI 的理论性质使得确定组织需要的确切技术栈具有挑战性。然而,如果 AGI 开发使用与狭义 AI 类似的构建块,那么一些现有的工具和科技将对采用至关重要。

AGI 中通用智能的确切性质仍然是 AI 研究人员争论的话题。有些人,如 Goertzel 和 Pennachin,认为 AGI 将拥有自我理解和自我控制能力。Microsoft 和 OpenAI 声称 GPT-4 的能力非常接近人类水平。大多数专家将其归类为一种强大但依然属于狭义 AI 的模型。

当前的 AI 进步在特定领域表现出令人印象深刻的能力。自动驾驶汽车擅长在道路上行驶,像 IBM Watson 这样的超级计算机可以分析大量数据。无论如何,这些都是狭义 AI 的例子。这些系统在其特定领域表现出色,但缺乏 AGI 所设想的一般问题解决能力。

无论如何,鉴于所预测的 AGI 到来时间是一个很广的范围,即从 2030 年到 2050 年甚至更远,管理好预期并从利用当前 AI 应用的价值开始着手至关重要。虽然领导者对当前 AI 的优势持一些保留意见,但组织正在积极投资生成式 AI 部署,大量增加预算,扩展用例,并将项目从实验过渡到生产。

根据 Andreessen Horowitz 的数据,2023 年,受访公司在基础模型应用程序编程接口 (API)、自托管和微调模型上的平均支出达到 700 万美元。几乎所有受访者都报告了生成式 AI 实验的早期成果,并计划在 2024 年增加支出以支持生产工作量。有趣的是,2024 年,软件中的资金投入发生了转移,从创新基金中分配预算的领导者减少,这暗示着生成式 AI 正在迅速成为一项必不可少的技术。

从较小规模来看,一些组织正在重新分配生成式 AI 方面的预算,以通过减少员工人数实现成本削减,特别是在客户服务方面。有组织报告称,其由 LLM 驱动的客户服务系统服务的每个呼叫可节省约 6 美元,相当于成本降低 90%,这是增加生成式 AI 投资的重要理由。

除了节省成本之外,组织还寻求切实可行的方法来衡量 AI 的投资回报率,重点关注诸如创收、成本节省、效率提高和准确性改进等因素,具体取决于用例。一个关键趋势是在生产中采用多种模型。这种多模型方法将多个 AI 模型组合在一起,以组合它们的优势并优化整体输出。这种方法还有助于根据具体用例量身定制解决方案,避免供应商锁定,并利用该领域的快速发展。

2024 年的调查中,46% 的受访者表示倾向于开源模型,而成本并不是主要驱动因素,这反映出人们越来越相信 AI 所创造的价值超过了其价格。这说明,高管越来越倾向于认为,获得准确的答案是物有所值的。

企业仍然对定制模型感兴趣,但随着高质量开源模型的兴起,大多数企业选择不从头开始进行 LLM 的训练。相反,他们使用检索增强生成或微调开源模型来满足他们的特定需求。

大多数 (72%) 使用 API 访问模型的企业使用托管在其云服务提供商处的模型。此外,那些不仅依赖 LLM 生成文本,还将其与其他技术集成以创建完整解决方案,并全面重新思考企业工作流程和专有数据使用的应用程序在市场上表现出色。

Deloitte 深入了解了生成式 AI 为 2,800 多名商业领袖创造的输出价值。以下是组织看到投资回报率的一些领域:

  • 文本 (83%):生成式 AI 可协助自动执行报告撰写、文档摘要和营销文案生成等任务。
  • 代码 (62%):生成式 AI 可帮助开发人员更高效地编写代码,并减少错误。
  • 音频 (56%):生成式 AI 客户服务中心可以利用逼真的音频为客户和员工提供帮助。
  • 图像 (55%):生成式 AI 可以模拟产品在客户家中的外观,或重建事故现场以评估保险索赔和责任。
  • 其他潜在领域:视频生成 (36%) 和 3D 模型生成 (26%) 可以创建营销材料、虚拟效果图和产品模型。

生成式 AI 发展的技能差距是一个重大障碍。由于企业内部难以获得合适的人才,因此提供简化内部生成式 AI 开发工具的初创公司可能会更快地被采用。

虽然 AGI 在实现机器自主方面的潜力远远超过生成式 AI,但即使是最先进的系统也仍然需要人类专业知识才能有效运行。建立一支具备 AI、深度学习机器学习 (ML) 和数据科学技能的内部团队是一项战略性措施。最重要的是,无论 AI 的强度(弱或强)如何,数据科学家、AI 工程师、计算机科学家和 ML 专家对于开发和部署这些系统都至关重要。

随着 AI 技术的进步,这些使用领域必将不断发展。然而,通过专注于这些核心领域,组织机构可以充分利用 AI 进步带来的力量。

改进 AI 以实现 AGI

尽管 AI 近年来取得了重大进展,但实现真正的 AGI(具有人类水平智能的机器)仍需克服重大障碍。以下是当前 AI 面临严重挑战且 AGI 需要掌握的 7 项关键技能:

  1. 视觉感知:虽然计算机视觉已经克服了面部识别和对象检测方面的重大障碍,但与人类的能力相比还有很大差距。当前的 AI 系统难以理解背景、颜色以及如何对部分隐藏的对象做出反应。
  • 音频感知:AI 在语音识别方面取得了进展,但无法可靠地理解重音、讽刺和其他情绪性语气。它还很难过滤不重要的背景噪音,并且很难理解非语言表达,例如叹息、笑声或音量变化。
  • 精细运动技能:AGI 软件与机器人硬件配对是可以想象的。在这种情况下,AGI 需要有能力处理易碎物体、在现实世界中操纵工具并能够快速适应新的物理任务。
  • 解决问题:弱 AI 擅长解决具体的、定义明确的问题,但 AGI 需要像人类一样通过推理和批判性思考来解决问题。AGI 需要处理不确定性,并在信息不完整的情况下做出决策。
  • 导航:自动驾驶汽车展示出令人印象深刻的能力,但类似人类的导航需要即时适应复杂环境。人类可以轻松地在拥挤的街道、不平坦的地形和不断变化的环境中导航。
  • 创造力:虽然 AI 可以在某种程度上生成创造性的文本格式,但真正的创造力涉及原创性和新颖性。创造新的想法、概念或解决方案是人类创造力的标志。
  • 社交和情感参与:人类智慧与我们的社交和情感能力密切相关。AGI 需要识别和理解情绪,包括解释面部表情、肢体语言和语气。为了对情绪做出适当的反应,AGI 需要根据他人的情绪状态调整自己的沟通方式和行为。

AGI 示例

然而,一旦理论 AGI 实现上述目标,并成为实际的 AGI,其潜在应用将是巨大的。以下是 AGI 技术如何彻底改变各个行业的一些例子:

客户服务

想象一下由 AGI 驱动的客户服务系统。它将访问大量客户数据,并将其与实时分析相结合,提供高效和个性化的服务。通过建立全面的客户档案(人口统计、过往体验、需求和购买习惯),AGI 可以预测问题、定制响应、建议解决方案,甚至预测后续问题。

示例:想象一下您曾经获得的最佳客户服务体验。AGI 可以通过感知系统提供此功能,该系统可以预测潜在问题,使用语气分析来更好地了解客户的情绪,并且具有敏锐的记忆力,可以回忆起最具体的案例解决细节。通过理解人类语言的微妙之处,AGI 可以进行有意义的对话、处理复杂问题并引导故障排除步骤。此外,它的情绪智力使其能够调整沟通以体现同理心和支持性,从而为客户创造更积极的互动。

编码智力

除了代码分析之外,AGI 还掌握现有代码库的逻辑和目的,提出改进建议并根据人类规范生成新代码。AGI 可以通过提供对架构、依赖关系和变更历史记录的硬编码理解来提高生产力。

示例:在构建电子商务功能时,程序员告诉 AGI:“我需要一个函数来根据位置、重量和方法计算运输成本。”AGI 会分析相关代码,生成函数草稿以及解释其逻辑的注释,让程序员可以对其进行审查、优化和集成。

导航、探索和自主系统

当前的自动驾驶汽车和自动驾驶系统严重依赖预编程的地图和传感器。AGI 不仅能感知周围环境,还能切实理解。它可以分析来自摄像头、LiDAR 和其他传感器的实时数据,以识别物体、评估风险并预测环境变化,例如突发天气事件或意外障碍物。与响应选项有限的当前系统不同,AGI 可以实时做出复杂的决策。

它可能会考虑多种因素,例如交通流量、天气状况,甚至超出直接传感器范围的潜在危险。由 AGI 驱动的系统不会局限于预编程路线。它们可能会从体验中学习,适应新情况,甚至深入了解未知地域。想象一下自动勘探车在复杂的洞穴系统中行进,或无人机在不断变化的环境中协助搜索和救援任务。

举例说明:一辆由 AGI 驱动的自动驾驶汽车在其常规路线上遇到了意想不到的交通堵塞。AGI 不会严格遵循预编程指令,而是分析来自其他联网车辆的实时交通数据。然后,它会确定替代路线,考虑距离、预计旅行时间和潜在危险(例如施工区域)等因素。最后,它实时选择最高效、最安全的路线,让乘客在整个旅程中时刻知情并感到舒适。

医疗保健

当今生成的大量医疗数据在很大程度上仍未得到适当利用。AGI 可以分析医学图像、患者记录和遗传数据,以识别可能未被人类注意的微妙模式。通过分析历史数据和医疗趋势,AGI 可以预测患者患某些疾病的特定潜在风险。AGI 还可能分析患者的基因组成和病史以定制治疗计划。这种个性化方法可能会带来更有效、副作用更少的疗法。

示例:一位有令人担忧的症状的患者去看医生。医生将患者的病史和最近的检查结果上传到 AGI 驱动的医学分析系统。AGI 分析数据并识别出与特定疾病相关的罕见基因突变。这些信息对医生至关重要,因为它可以带来更有针对性的诊断,并制定个性化的治疗计划,有可能改善患者的治疗效果。

教育

想象一下,一位 AGI 导师不提供信息,但对学习过程进行个性化设置。AGI 可以分析学生的表现、学习风格和知识差距,以创建定制的学习路径。它不会以千篇一律的方式对待所有学生。AGI 可以根据学生的理解情况实时调整材料的速度和难度。对某个概念感到困惑?AGI 提供其他解释和示例。掌握了一个主题?它可以引入更具挑战性的材料。AGI 可能会超越讲座和教科书。它可能创建交互式模拟、个性化练习甚至游戏化的学习体验,以保持学生的参与度和积极性。

举例说明:一名学生在学习复杂的数学概念时遇到困难。AGI 导师识别困难并调整其方法。它不是枯燥的讲座,而是通过交互式模拟直观地呈现概念,并将其分解为更小、更易于管理的步骤。学生通过个性化练习来弥补自己的知识差距,AGI 会在整个过程中提供反馈和鼓励。

制造和供应链管理

AGI 可能会优化流程的每一步,从而彻底改变制造业。通过分析来自整个生产线传感器的大量数据来识别瓶颈,AGI 可能建议调整机器设置并实时优化生产计划,以实现效率最大化。分析历史数据和传感器读数可能有助于 AGI 在设备故障发生之前进行预测。这种主动方法可以避免代价高昂的停机并有助于确保运营顺利。AGI 可实时管理复杂的物流网络,从而优化交付路线、预测潜在的延误并调整库存水平,协助确保准时交付,最大限度减少浪费和存储空间成本。

示例:想象一下,一个 AGI 系统监控着一条工厂装配线。它可以检测到关键机器的轻微振动,确认可能存在严重的磨损。AGI 可分析历史数据,并预测未来 24 小时内可能出现的故障。它会向维护人员发出警报,维护人员可以在问题影响生产之前主动解决问题。这样可以实现平稳高效的运行,避免代价高昂的停机。

金融服务

AGI 可能会超越传统方法,彻底改变金融分析。AGI 可以分析涵盖金融新闻、社交媒体情绪甚至卫星图像的大量数据集,以识别复杂的市场趋势和可能被人类分析师忽视的潜在干扰。一些初创企业和金融机构已经在研究和此类技术的有限制版本。

由于能够处理大量历史数据,AGI 可以创建更准确的金融模型来评估风险并做出更明智的投资决策。AGI 可以开发并运行复杂的交易算法,其中会考虑市场数据、实时新闻和社交媒体情绪。然而,人工监督对于最终决策和道德考量仍然至关重要。

示例:一家对冲基金使用 AGI 系统来分析金融市场。AGI 可检测到社交媒体对特定行业情绪的微妙变化,并识别出潜在的衰退。它通过分析历史数据和新闻文章,确认可能出现的市场调整。有了这些信息,基金经理就能做出明智的决定,调整投资组合,降低风险。

研究和开发

AGI 可以分析大量的数据集和科学文献,提出新的假设,并以前所未有的规模设计实验,从而加速各个领域的科学突破。想象一下,一个科学伙伴可以通过分析大量的科学数据集和文献,识别人类研究人员可能忽略的细微模式和联系,完成细致的数据检视并产生突破性的想法。这可能会催生全新的假设和研究途径。

通过模拟复杂系统和分析大量数据,AGI 能够以前所未有的规模设计复杂的实验。这将使科学家能够更有效地检验假设并深入了解以前难以想象的研究前沿。AGI 可能会不知疲倦地工作,帮助研究人员筛选数据、管理复杂的模拟并提出新的研究方向。这种合作将大大加快科学突破的步伐。

举例说明:一个天体物理学家小组正在研究宇宙早期星系的形成。AGI 分析来自望远镜和模拟的大量数据集。它确定了暗物质分布与星团形成之间以前被忽视的相关性。基于此,AGI 提出了一个关于星系形成的新假设,并建议进行一系列创新模拟来测试其有效性。这些新发现的知识为更深入地了解宇宙的起源铺平了道路。

AGI 有哪些类型?

AGI 将成为一项有影响力的技术,永远改变医疗保健或制造业等行业开展业务的方式。大型科技公司和研究实验室正在投入大量资源进行开发,各种学派都在努力解决让机器获得真正人类水平智能的难题。以下是几个主要的探索领域:

  1. 符号 AI:此方法侧重于构建能够操纵符号和逻辑来表示知识和推理的系统。它旨在创建一个可以通过遵循规则来理解和解决问题的系统,类似于人类使用逻辑的方式。
  • 联结主义 AI(人工神经网络):这种方法受到人脑结构和功能的启发。它涉及构建具有互连节点的人工神经网络,以基于大量数据进行学习和处理信息。
  • 人工意识:该领域研究赋予机器主观体验和自我意识。这是一个高度理论化的概念,但可能是真正智能的关键组件。
  • 全脑模拟:这种雄心勃勃的方法旨在创建生物大脑的详细计算机模拟。该理论认为,意识和智能可能通过复制人脑的结构和功能在模拟中出现。
  • 具身 AI 和具身认知:这种方法侧重于研究智能体的物理身体及其与环境的互动在塑造智能方面的作用。其想法是,真正的智能需要一个智能体通过物理身体来体验世界并从中学习。

AGI 研究领域在不断发展。这些只是已深入了解的一些方法。这些技术的结合或全新的方法可能最终会实现 AGI。

AI 的运转是商业的未来

AGI 目前可能还只是科幻小说,但组织可以利用 IBM watsonx 为业务制定 AI 战略,为未来做好准备;IBM watsonx 是一个 AI 产品组合,可以提升生成式 AI 在工作流中的影响,从而提高生产力。训练、验证、调整和部署 AI 模型,帮助您利用整个企业的可信数据来扩展和加速 AI 的影响。

 
相关解决方案
IBM watsonx.ai

使用面向 AI 构建器的新一代企业级开发平台 IBM watsonx.ai,可以训练、验证、调整和部署生成式 AI、基础模型和机器学习功能。使用一小部分数据,即可在很短的时间内构建 AI 应用程序。

了解 watsonx.ai
人工智能 (AI) 解决方案

借助 IBM 业界领先的人工智能专业知识和解决方案组合,让人工智能在您的业务中发挥作用。

深入了解 AI 解决方案
AI 咨询与服务

通过增加 AI 重塑关键工作流程和运营,最大限度提升体验、实时决策和商业价值。

深入了解人工智能服务
采取后续步骤

一站式访问跨越 AI 开发生命周期的功能。利用用户友好型界面、工作流并访问行业标准 API 和 SDK,生成功能强大的 AI 解决方案。

深入了解 watsonx.ai 预约实时演示