什么是 IT 运营?
IT 运营以及 AIOPs 负责监督和自动执行整个组织中 IT 服务的管理、交付和支持
订阅 IBM 时事通讯
黑色和蓝色背景
什么是 IT 运营(ITOps)?

信息技术运营 — 通常称为 IT 运营,或是 ITOps ,是实施、管理、 交付和支持 IT 服务的过程, 旨在满足内部和外部用户的业务需求。

ITOps 是  IT 部门的核心职能,通常向首席信息官 (CIO) 汇报工作。 它与技术管理、应用管理和服务台管理共同组成 IT 基础架构库  (ITIL)的四项基本职能,是 IT 服务管理事实上的行业标准和最佳实践框架。 

ITOps  处于 IT 服务 交付的最前沿,它是用于确保组织持续正常运营的机制中最重要的组成部分之一。 企业及其客户高度依赖于对 IT  服务的即时访问,包括数据、软件应用、 公有云 和 私有云 资源,这些服务即使短暂中断,也可能导致影响巨大、损失惨重的后果。

近年来, ITOps 任务逐渐由人工智能 (AI)  软件承担,形成了一个新的 IT  运营子领域,称为 人工智能 运营,通常简称为  AIOps

 自然语言处理 (NLP) 和 机器学习 (ML) 模型等 AI 能力 被用于自动执行诸多 ITOps 任务,例如收集和汇总 海量数据,将重大事件警报与 IT 运营数据的"噪音"分开并确定其优先级, 以及关联数据 以确定根本原因并提出解决方案。

详细了解 IBM AIOps

 

IT 运营的作用

无论是在金融、电信还是零售行业,当今的企业及其客户都高度依赖于对应用的即时访问,并希望获得无缝的客户体验。 这需要应用和支持应用运行的 IT 资源(例如 公有云 和 私有云 基础架构、数据、网络和服务)表现出最优性能。 即使是短暂的 IT 中断也会对业务运营产生严重影响,并迅速造成重大损失。 IT 运营的主要作用是确保 IT 和业务技术的平稳运行,保证业务不间断运营。

ITOps 的职责包括:

  • 管理资源: ITOps 负责确保 IT 基础架构持续运行。 这包括硬件、软件和网络基础架构,以及在上面运行的应用。 ITOps 团队负责为 DevOps 团队管理和提供 IT 基础架构资源,并为客户及合作伙伴维持服务交付与运营。 这包括管理私有云、公有云及混合云环境、数据中心位置和设备、操作系统、互联网连接、防火墙和网络安全以及其他 IT 基础架构组件。
  • 优化 IT 基础架构: ITOps 还负责寻找改进基础架构和性能的方法,同时安全地降低成本。 为此,团队需要记录硬件配置,实施可确保最优性能的配置,以及管理 IT 工作负载,执行软件、硬件和操作系统升级,并评估建议的基础架构变更会产生的影响。
  • 确保应用性能: ITOps 在与业务部门负责人和应用负责人协作以确保应用性能方面,发挥着关键作用。 ITOps 通常会为应用负责人收集有关资源配备决策的建议,以确保应用获得所需的计算、存储和网络资源,防止应用性能下降和发生中断。
  • 服务台支持: 在一些组织中,服务台是 IT 部门中的一个独立团队,而在另一些组织中,服务台支持由 ITOps 承担。 管理服务台和问题凭单系统、诊断问题以及解决 IT 相关问题的根本原因都在支持范围之内。
  • 事故及安全管理: ITOps 不仅关注 IT 服务的日常可用性,而且还要制定计划,以便防患于未然,确保未来的可用性。 这包括执行数据备份、在中断后还原系统、制定灾难恢复计划、建立用于评估性能的指标、执行审计以及开展合规工作。
IT 运营与 IT 运营管理
人们经常将

ITOps 与 IT 运营管理 (ITOM) 混淆,因为这两者都与保持 IT 服务的持续正常运行密切相关。 ITOPs 是指与 IT 服务管理相关的人员、角色和任务,而 ITOM 则指用于维持企业日常使用的技术组件、计算需求和业务流程的管理流程和工具。 ITOps 团队负责监督 IT 环境中的服务以及所有资源和 IT 应用的可用性,无论它们属于日常任务还是长期战略规划。 ITOM 是 ITOps 中的一部分,包括用于确保 IT 资源交付的整体质量、效率和最终用户体验的常规流程以及用于实现这一目标的工具。

ITOps 与 DevOps

DevOps 旨在通过自动执行以及整合开发与 IT 运营团队的工作,加速交付更高质量的软件。 通过将这些以前孤岛化的单位衔接起来,组织可以建立以持续沟通、通力协作和共担责任为特色的软件开发和交付流程。 最终可以加快工作流的执行,简化流程,频繁提供创新型新功能,确保卓越的性能和不间断的可用性,满足软件用户不断增长的需求。

在 DevOps 模式中,IT 团队通过提供配置、安装和故障排除支持以及数据库管理和网络基础架构管理,支持软件开发和测试过程。 他们还负责确保基础架构满足开发团队的需求。 为实现此目的,他们可利用应用资源管理 (ARM) 工具,保证应用在需要时获得相应的资源。

在整个 DevOps 生命周期中,IT 和开发团队通常会使用自动化技术来确定依赖关系并测试问题。 DevOps 和 ITOps 使用 应用性能监控 (APM) 和 可观察性 工具,自动分析问题的根本原因,并在部署新代码或更改系统时,在软件交付管道的每一步获得即时反馈。 这种协作使持续交付和部署管道能够平稳高效地运行,加快新应用和增强功能的面市速度。

AIOps:IT 运营的未来

AIOps 是指应用人工智能 (AI) 能力,例如自然语言处理和机器学习模型,自动执行和简化运营工作流程。 AIOps 不仅为自动化和高效率创造了机会,而且还直接解决了当今 IT 团队面临的重大挑战。 IT 基础架构组件、应用和性能监控工具会生成海量 IT 运营数据 — 随着组织实施 数字化转型 并采用 云计算 服务和混合云环境,这些数据量会迅速飙升。 事实上,Gartner 估计,企业 IT 基础架构平均每年产生的 IT 运营数据都会比上年增加 2 到 3 倍。

为了更好地处理和利用这些数据,IT 运营团队减少了对基于域的 IT 管理工具以及人工监控和干预的依赖,逐渐转向由数据驱动、由 AI 支持的自动化技术。

AIOps 通过在以下方面提供帮助,提高 IT 运营团队的敏捷性和响应速度:

  • 收集并汇总由多个 IT 基础架构组件、应用和性能监控工具以及服务台问题凭单系统生成并不断增长的海量数据
  • 通过自动建立基线,检测异常情况,将用户从基于规则的系统转移到易于使用的动态 AI 和 ML 系统
  • 减少问题单数量,对事件和异常情况进行分组,并将重大事件警报与周围的 IT 运营数据分开并确定其优先级
  • 为分布在整个企业中的事件提供经过分析的背景信息
  • 关联历史和实时数据,以确定问题的根本原因并提出解决方案
  • 使人力密集型 IT 流程实现自动化,并主动缓解会产生重大影响的触发因素
  • 使用预先训练的模型快速获得洞察,加速实现价值 (TTV)
  • 通过更高的可视性和自动化的事件管理和响应能力,缩短平均检测时间 (MTTD) 和平均解决时间 (MTTR)
  • 通过推动动态资源分配实现自动化,以零浪费的方式满足实时需求,从而提高运营效率并安全地降低 IT 成本
  • 构建自动化策略库,进一步减少人工管理和流程
相关解决方案
IBM Cloud

IBM Cloud 与 Red Hat 强强联合,提供市场领先的安全性、企业可扩展性和开放式创新,发挥云计算和 AI 的全部潜力。

探索 IBM Cloud
AI 支持的自动化

我们可以为您提供 AI 支持的自动化,从业务工作流程到 IT 运营全覆盖。 探索多家领先企业如何实现转型。

探索 AI 支持的自动化
智能 IT 运营

IBM Cloud Pak for Watson AIOps 是一款 IT 运营管理解决方案,帮助 IT 运营商将 AI 置于 ITOps 工具链的核心位置。

探索智能 IT 运营
资源 Forrester 总体经济影响调研

IBM® Turbonomic® Application Resource Management 与您现有的 ITOps 解决方案集成,将孤岛化的团队和数据衔接起来,并将被动式的人工流程转变为持续的应用资源优化,以确保应用性能,同时安全地将云使用量减少 33%。

面向 IT 运营的 AI (AIOps) 架构

使用 AI 解决 IT 运营问题。

采取下一步行动

为了使 ITOps 能够与业务运营的速度同步并保持竞争优势,企业必须利用数据主动地不断学习,并通过 AIOps 优化其 IT 环境。 在 AIOps 的帮助下,ITOps 可以借助实时洞察,支持企业做出明智的决策,并自动执行重复性任务。

探索 IBM IT 自动化产品服务组合