超越 RFP 和聊天机器人:AI 如何优化 IT 基础设施和运营

一名男子正在查看服务器中的接线

作者

Mesh Flinders

Staff Writer

IBM Think

Ian Smalley

Staff Editor

IBM Think

如今,关于人工智能 (AI) 的大部分重大新闻都围绕着新型、前沿的生成式 AI (Gen AI) 应用的开发。从帮助学生撰写论文,到在几秒钟内填写 RFP,再到(拙劣地)准备法律案件,其成功与失败都已被充分记录。

但是,那些更平凡的任务呢?一些组织正在尝试部署 AI 来自动化 IT 基础设施和运营的各个方面,从而将宝贵的人类专业知识投入其他地方。

IBM 商业价值研究院全球研究主管 Richard Warrick 表示:“生成式 AI 是许多现代企业打造新数字产品以盈利的核心。”但是,如果同样的技术可以从根本上改变设计、部署、管理和观察这些应用所需的业务流程,会怎么样呢?”

从自动化数据中心配置和 DevOps 等资源密集型流程 到取代现场安全人员,智能 AI 自动化正在改变 IT 基础设施和运营。

小球在轨道上滚动的三维设计

最新的 AI 新闻 + 洞察分析

在每周的 Think 时事通讯中,发现专家精选的有关 AI、云等的洞察分析和新闻。 

AI 自动化的演变

当 AI 最初被用于商业目的时,它能够自动执行以前需要人工输入的重复性任务的能力被认为是其最有价值的应用。随着生成式 AI 及其诸多能力的出现,这种观念现在看来有些过时;但是,尽管 AI 能够予以自动化的任务的性质可能已经改变,但自动化本身的基本价值却没有改变。

根据 IBV 最近的一项研究,80%的高管计划在未来三年内实现其 IT 网络运营的自动化,同时 76% 的高管打算在这一时期内将同样的 AI 技能应用于 IT 运营。

Warrick:“借助人工智能驱动的智能工作流程和 IT 自动化工具,企业领导者能够在性能方面找到他们之前未曾获得的竞争优势。”

十年前,AI 被用来执行基于规则的简单流程,这种技能被称为基于规则的自动化。早期基于规则的 AI 的例子包括机械臂和工厂装配流水线的运作。虽然基于规则的 AI 工具在某些领域有效,但它们缺乏应用于更广泛的业务问题的灵活性和可扩展性。基于规则的系统依赖于一组预定义的规则,并且随着需要执行的任务变得越来越复杂,系统运行所需的规则数量也会增加,最终创造出不可扩展的系统。

机器学习 (ML) 和深度学习

20 世纪 90 年代,科学家们开始开发能够“学习”如何像人类大脑一样,通过大量数据来得出结论的计算机程序。这一人工智能分支被称为机器学习 (ML),它使技术能够处理越来越复杂的任务,如语音和手写识别、复杂游戏对战,甚至能够辅助医疗诊断。

深度学习是机器学习的一个子集,在 2010 年代开始流行,它将 AI 系统能够处理的复杂程度提升到了全新的水平。通过对多层神经网络进行训练,深度学习程序模拟了人类大脑做出决策的复杂而微妙的方式,使得 AI 能够构建应用程序、解释图像和视频,甚至像人类一样对语音和文本提示做出反应。

如今,得益于 ML 和深度学习,AI 自动化已经从简单的基于规则的流程,演变基于海量数据集训练的丰富而复杂的模型,这些模型可以执行许多与人类同行相同的任务。这一波被称为“智能自动化”的新型 AI 工具,正在通过简化业务流程、分析数据以及解决以往需要人工干预的复杂问题,帮助组织优化其 IT 基础设施和运营。

AI 学院

利用混合云实现 AI 就绪

本课程由 IBM 资深思想领袖带领,旨在帮助企业领导者获得所需的知识,以便划分可以推动增长的 AI 投资的优先级。

智能 AI 自动化如何改变 IT 基础设施和运营

现代企业需要将最聪明、最专注技术的人才集中于那些有可能带来最大商业价值的计划,而现在,这意味着开发生成式 AI 应用程序。根据 IBV 的另一项研究,64% 的 CEO 报告称感受到来自投资者、债权人和放款人的压力,要求他们加快生成式 AI 的采用,超过一半的 CEO 表示他们感受到来自员工的同类压力。

然而,生成式 AI 应用需要复杂基础设施的支持,以便促进海量数据的收集、处理和安全存储。以往,这项工作由 IT 经理、工程师和数据科学家团队负责,但如果这项工作能由 AI 来完成呢?

智能 AI 自动化利用计算机视觉、自然语言处理 (NLP) 等专业技能和其他先进的 AI 技术来解决高度复杂的业务问题。AI 模型使用机器学习 (ML) 和深度学习在海量数据集上训练,可以分析来自应用程序和系统的数据,快速识别模式,并在问题发生之前相应地调整资源和流程。

计算机视觉

计算机视觉是一种能够像人类大脑一样解读图像和视频的 AI 技术。AI 模型利用 ML 和深度学习技术反复分析数据,最终能够识别出图像和视频中的相关差异。例如,一个被训练用于保障家庭安全的 AI 模型,需要接受数千小时的家庭安全监控视频的训练,以便学会识别可能的入侵者。

在IT基础设施中,计算机视觉被用于执行以前需要人工干预的各种任务,包括预测性维护、系统监控、数据流处理等。

  • 预测性维护:经过专门训练的计算机视觉系统使用图像识别算法,在物理组件(如电缆和服务器)出现问题并导致网络停机之前,就能检测到这些问题。
  • 系统监控:计算机视觉可以比人类更快地准确分析来自各种不同来源的大量数据。检查地铁隧道、高速公路和建筑物的摄像机角度需要人类花费数小时的时间,但计算机视觉机视觉系统可以实时完成。
  • 数据流处理:计算机视觉系统处理和分析来自物理传感器的大量数据,这些传感器跟踪关键指标,如温度、湿度、风速等。依靠计算机视觉来检测环境中的突发变化,通常能让组织立即察觉到问题。

自然语言处理

自然语言处理 (NLP) 是 AI 的一个领域,侧重于如何训练计算机使用人类语言进行理解和交流。NLP 帮助系统识别和理解人类语音,并生成文本以响应提示。

最近,NLP 在 ChatGPT 的开发和推出方面发挥了关键作用。ChatGPT 是一款开创性的聊天机器人,可以理解并生成类似人类的文本来响应问题和提示。

在 IT 基础架构和运营方面,NLP 可帮助组织完成以前需要人工输入的各种任务,如改善用户体验、工单解决和情感分析:

  • 用户体验:NLP 使用户能够像与客户服务代表交谈一样询问有关复杂 IT 情况的问题,并获得有用的答案。经过大量技术知识训练并配备 NLP 技能的聊天机器人可以取代拥有多年技术知识的客户服务代表。
  • 工单解决:AI NLP 系统能够分析传入的工单,并根据重要性和类型准确地对它们进行优先级排序和分类。AI 系统甚至可以被训练成自行解决问题,在需要时请求人工干预,或采取其他适当的行动。
  • 情感分析:NLP 系统可以对用户反馈、调查甚至社交媒体帖子进行情感分析,从而准确衡量响应背后的情绪并确定需要改进的领域。此外,NLP 系统还可以帮助整理专业技术信息,改进整个组织的文档和 IT 知识共享。

智能 AI 自动化用例

将智能 AI 自动化应用于 IT 基础架构和运营,正在改变 IT 经理监控和优化系统以及分配关键资源的方式。以下是该技术正在帮助转变流程、降低成本并发现核心业务实践中有意义见解的四个领域的示例。

数据中心运营

AI非常擅长发现数据中的模式,这使其非常适合分析每天在企业数据中心中流动的海量数据。数据中心运营商已开始采用AI来帮助他们发现数据中的模式,并识别自动化和流程简化的机会,这是提高数字化转型举措投资回报率 (ROI) 的关键部分。

在能源使用这个领域中,AI 已经在改善数据中心的运营。AI 系统可以监控和动态调整冷却系统,并对电力消耗进行管理,帮助企业节省数百万美元;在一个案例中,AI 系统将数据中心的能源账单金额降低了 40%。

数据治理

AI正越来越多地被用于自动化数据治理的某些方面,数据治理是在收集、存储和处理过程中维护数据完整性和安全性的过程。随着生成式 AI 的兴起,企业发现他们需要收集和管理的数据量远超以往。由于他们所需的数据通常在一个地方收集,而在另一个地方存储和处理,因此要遵守相关的合规法律可能颇具挑战性。AI 系统能够自动化合规流程的某些方面,根据法律法规进行更新,而无需人工干预,从而使整个流程更加高效和安全。

可观察性

人工智能在可观测性方面正发挥着越来越重要的作用。可观测性是IT运营的一个方面,它帮助组织根据复杂系统的输出了解这些系统的状况可观测性可以应用于各种基础设施组件,包括服务器、应用程序、网络设备等。

经过可观测性训练的 AI 模型会监控这些系统的数据,并分析其中的错误和低效之处。借助先进的智能 AI 自动化技术,一些 AI 系统甚至能够精准定位某些问题的根源,并在这些问题影响应用程序的可用性、性能或安全性之前采取适当的行动。

供应

除了监控系统和应用程序的性能与可用性外,AI 还在变革资源调配过程,即向系统和用户提供硬件和软件资源的过程。如今,先进的 AI 系统能够自动化资源调配,帮助企业更高效地分配云计算资源,从而避免机器闲置和整体性能下降。在资源调配过程中,智能 AI 自动化的市场机遇十分显著:根据 Flexera 的行业报告,超过 32% 的云支出因资源调配不当而被浪费。1

DevOps

AI 系统正被用于改进 DevOps,这是一种软件开发方法,它在程序员和 IT 运营之间架起了一座桥梁。一些企业已利用 AI 来实现软件测试的自动化,从而加快开发速度。其他一些则部署了 AI 算法来分析管道数据并改善资源分配。还有一些企业越来越依赖生成式 AI 来编写代码、测试代码、识别错误,甚至提出潜在的修复建议。

IBM 院士 Kyle Brown 表示,AI 不仅用于自动化 DevOps 的某些方面,还将用于自动化整个平台。他表示:“如今,大家可以实施一个通用的 AI DevOps 开发运维平台,这个平台完全由配置驱动且是彻底自动化的。无论开发团队在做什么,如果他们在其中一个平台上构建,他们都将遵循企业设定的指导方针。”

展望未来

尽管生成式 AI 及其在商业应用中的潜力可能仍占据着大部分头条新闻,但那些将 AI 应用于支撑IT的系统和流程的组织正在发现降低成本、改造过时系统和流程的新方法。从自动化资源密集型任务(如资源调配、合规检查和软件测试),到监控复杂系统以防入侵,再到从海量数据集中实时挖掘洞察分析,这一领域的创新潜力是无限的。

现代 AI IT 基础设施和运营解决方案(AIOps 解决方案)提供了一套完整、完全集成的 AI 驱动工具,可实现流程自动化并提供有关系统和应用程序的性能和健康状况的深刻洞见。Brown 说:“这些现代工具对于 IT 运营团队来说是天赐之物。仅以一个领域为例,例如规划,我们已经看到智能 AI 自动化将硬件和其他资源的计划支出削减了一半。”

相关解决方案
数据与 AI 分析

使用开源框架和工具,将 AI 和机器学习应用于 IBM® zSystems 大型机上最有价值的企业数据。

探索 IBM Z
AI 基础设施解决方案

IBM 提供 AI 基础设施解决方案并通过混合设计战略来加快对整个企业产生的影响。

深入了解 AI 基础设施解决方案
AI 咨询与服务

通过 IBM Consulting 发掘企业数据的价值,建立以洞察分析为导向的组织,实现业务优势。

深入了解人工智能服务
采取后续步骤

使用针对性能、可靠性和混合云集成进行优化的基础设施,为您的 AI 工作负载提供支持,从而满足真正的企业需求。

深入了解 AI 基础设施解决方案 获取更多信息
脚注

所有链接均为 ibm.com 外部链接

1. Flexera 2024 云现状报告,Flexera,2024 年