什么是 IT 运营 (ITOps)?

一群商务人士正在工作,团队坐在会议室的桌子旁看着一台笔记本电脑

什么是 ITOps?

信息技术运营(通常称为 IT 运营或 ITOps)是实施、管理、交付和支持 IT 服务以满足内部和外部用户的业务需求的过程。

ITOps 是 IT 部门的核心职能,通常向首席信息官汇报。它是 IT 基础架构库 (ITIL) 中定义的四种功能之一(其他三种为技术管理、应用程序管理和服务台管理),ITIL 是 IT 服务管理事实上的行业标准最佳实践框架。

ITOps 处于 IT 服务交付的最前沿,是维持组织正常运转的机器中最重要的齿轮之一。企业及其客户已经变得非常依赖即时访问 IT 服务(数据、软件应用程序、公有云私有云资源),以至于即使这些服务出现小规模中断,也可能产生深远且代价高昂的后果。

近年来,ITOps 任务越来越多地被 AI 软件承担,形成了 IT 运营的一个新子领域,称为 AI 运营,或简称 AIOps

自然语言处理 (NLP)机器学习 (ML) 模型等 AI 功能正被用于自动化 ITOps 任务,如收集和汇总海量数据,从 IT 运营数据的噪音中分离重要事件警报并确定其优先级,以及关联数据以确定根本原因并提出解决方案。

小球在轨道上滚动的三维设计

最新的 AI 新闻 + 洞察分析

在每周的 Think 时事通讯中,发现专家精选的有关 AI、云等的洞察分析和新闻。 

IT 运营的作用

无论是金融行业、电信行业还是零售业,当今的企业及其客户都依赖于即时访问应用程序并期望获得无缝的客户体验。这就要求应用程序以及应用程序运行所依托的支持性 IT 资源(如公有云私有云基础设施、数据、网络和服务)发挥最佳性能。即使是短暂的 IT 中断也会对业务运营产生重大影响,并很快变得代价高昂。IT 运营的主要作用是确保 IT 和业务技术的流畅性能,以便业务运营能够不间断地进行。

ITOps 的职责包括:

  • 管理资源:ITOps 保持 IT 基础设施的运行。这包括硬件、软件和网络基础设施,以及在其上运行的应用程序。ITOps 团队负责为 DevOps 开发运维团队管理和配置 IT 基础设施资源,并维护客户和合作伙伴的服务交付和运营。这包括管理私有云、公有云和混合云环境、数据中心位置和设备、操作系统、互联网连接、防火墙和网络安全以及其他 IT 基础设施组件。
  • 优化 IT 基础设施:ITOps 还想方设法改进基础设施和性能,同时安全地降低成本。为此,团队记录硬件配置并实施确保最佳性能的配置,以及管理 IT 工作量、实施软件、硬件和操作系统升级,并评估拟议的基础设施变更的影响。
  • 确保应用程序性能:ITOps 在与业务线负责人和应用程序负责人协作以确保应用程序性能方面发挥着关键作用。ITOps 经常为应用程序负责人收集资源决策建议,以确保应用程序获得所需的计算、存储和网络资源,防止速度减慢和中断。
  • 服务台支持:虽然在某些组织中,服务台是 IT 部门的子集,但在其他组织中,支持工作由 ITOps 负责。管理帮助台和工单系统、排查问题以及应对 IT 相关问题的根本原因都属于其支持范围。
  • 事件和安全管理:ITOps 不仅关注 IT 服务的日常可用性,还制定计划,在出现问题时确保未来的可用性。这包括执行数据备份、中断后恢复系统、制定灾难恢复计划、建立评估性能的指标、审计和遵守法规。
AI 学院

利用混合云实现 AI 就绪

本课程由 IBM 资深思想领袖带领,旨在帮助企业领导者获得所需的知识,以便划分可以推动增长的 AI 投资的优先级。

IT 运营与 IT 运营管理

ITOps 经常与 IT 运营管理 (ITOM) 混淆,因为两者都与保持 IT 服务的正常运行密切相关。ITOps 指与 IT 服务管理相关的人员、角色和任务,而 ITOM 指用于维护企业日常使用的技术组件、计算要求和业务流程的管理流程和工具。ITOps 团队监督 IT 环境中的服务以及所有资源和 IT 应用程序的可用性,无论是日常任务还是长期战略规划。ITOM 是 ITOps 的一个子集,包括确保 IT 资源交付的整体质量、效率和用户体验的常规流程以及用于实现这一目标的工具。

ITOps 与 DevOps

DevOps 开发运维旨在通过自动化并整合开发和 IT 运营团队的工作,来加快更高质量软件的交付。通过将这些以前孤立的单元连接起来,组织可以通过持续沟通、协作和分担责任,构建软件开发和交付流程。最后获得更快的工作流程和简化的流程,满足软件用户对频繁、创新功能以及不间断的性能和可用性不断增长的需求。

在 DevOps 开发运维模型中,IT 团队通过提供配置、安装和故障排除支持、数据库管理和网络基础设施管理,来支持软件开发和测试流程。他们还确保基础设施满足开发团队的需求。实现此目标的一种方法是使用应用资源管理工具,确保应用程序在需要时拥有所需的资源。

在整个 DevOps 开发运维生命周期中,IT 和开发团队都会努力识别依赖关系并测试问题,通常会使用自动化手段。DevOps 开发运维和 ITOps 使用应用程序性能监控 (APM)可观测性工具来自动分析问题的根本原因,并在部署新代码或对系统进行更改时,在软件交付管道的每个步骤立即获得反馈。这种协作使持续交付和部署管道能够顺畅高效地流动,从而缩短新应用程序和增强功能的上市时间。

AIOps:IT 运营的未来

AIOps 是将 NLP 和机器学习模型等 AI 功能应用于自动化和简化工作流。AIOps 不仅为自动化和效率创造了机会,而且还直接解决了当今 IT 团队面临的重大挑战。IT 基础架构组件、应用程序和性能监控工具会产生大量的 IT 运营数据--随着企业进行数字化转型并采用云计算服务和混合云环境,这些数据量会迅速增加。Gartner 估计,普通企业 IT 基础架构每年产生的 IT 运营数据增加了两到三倍。

为了更好地管理和充分利用这些数据,IT 运营团队减少了对基于域的 IT 管理工具以及手动监控和干预的依赖,并越来越多地转向数据驱动、人工智能驱动的自动化。

AIOps 通过辅助以下工作促使 IT 运营团队提高敏捷性和响应能力:

  • 收集和汇总由多个 IT 基础设施组件、应用程序、性能监控工具和服务工单系统生成的大量结构化和非结构化数据
  • 利用自动确定基线来检测异常,使用户从基于规则的系统转向动态、易于使用的 AI 和 ML 系统
  • 减少工单数量、群体事件和异常,并将重大事件警报与周围的 IT 运营数据分开并确定其优先级
  • 提供经过分析的事件背景,在整个企业范围内进行拼接
  • 关联历史数据和实时数据,以确定问题的根本原因并提出解决方案
  • 实现劳动密集型 IT 流程自动化,主动缓解高影响触发因素
  • 利用预先训练的模型快速获得洞察力,从而加速价值实现
  • 通过增强可视性和自动化事件管理和响应,缩短平均检测时间和平均解决时间
  • 通过推动动态资源配置自动化,以零浪费的方式满足实时需求,从而提高运营效率并安全地降低 IT 成本
  • 建立自动化策略库,进一步减少手动管理和流程
相关解决方案
IBM Cloud Infrastructure Center

IBM Cloud Infrastructure Center 是一款兼容 OpenStack 的软件平台,用于管理 IBM zSystems 和 IBM LinuxONE 上的私有云基础架构。

深入了解 Cloud Infrastructure Center
IT 基础架构解决方案

发现专为企业混合云和 AI 策略设计的服务器、存储器和软件。

探索 IT 基础架构解决方案
云基础设施解决方案

查找适合企业的业务需求的云基础设施解决方案,并按需扩展资源。

云解决方案
采取后续步骤

利用 IBM 的混合云和 AI 就绪解决方案来实现企业基础设施转型。了解旨在保护、扩展和实现企业的现代化改造的服务器、存储和软件,或获取专家洞察分析,从而强化您的生成式 AI 战略。

探索 IT 基础架构解决方案 下载电子书