信息技术运营 — 通常称为 IT 运营,或是 ITOps ,是实施、管理、 交付和支持 IT 服务的过程, 旨在满足内部和外部用户的业务需求。
ITOps 是 IT 部门的核心职能,通常向首席信息官 (CIO) 汇报工作。 它与技术管理、应用管理和服务台管理共同组成 IT 基础架构库 (ITIL)的四项基本职能,是 IT 服务管理事实上的行业标准和最佳实践框架。
ITOps 处于 IT 服务 交付的最前沿,它是用于确保组织持续正常运营的机制中最重要的组成部分之一。 企业及其客户高度依赖于对 IT 服务的即时访问,包括数据、软件应用、 公有云 和 私有云 资源,这些服务即使短暂中断,也可能导致影响巨大、损失惨重的后果。
近年来, ITOps 任务逐渐由人工智能 (AI) 软件承担,形成了一个新的 IT 运营子领域,称为 人工智能 运营,通常简称为 AIOps。
自然语言处理 (NLP) 和 机器学习 (ML) 模型等 AI 能力 被用于自动执行诸多 ITOps 任务,例如收集和汇总 海量数据,将重大事件警报与 IT 运营数据的"噪音"分开并确定其优先级, 以及关联数据 以确定根本原因并提出解决方案。
无论是在金融、电信还是零售行业,当今的企业及其客户都高度依赖于对应用的即时访问,并希望获得无缝的客户体验。 这需要应用和支持应用运行的 IT 资源(例如 公有云 和 私有云 基础架构、数据、网络和服务)表现出最优性能。 即使是短暂的 IT 中断也会对业务运营产生严重影响,并迅速造成重大损失。 IT 运营的主要作用是确保 IT 和业务技术的平稳运行,保证业务不间断运营。
ITOps 的职责包括:
ITOps 与 IT 运营管理 (ITOM) 混淆,因为这两者都与保持 IT 服务的持续正常运行密切相关。 ITOPs 是指与 IT 服务管理相关的人员、角色和任务,而 ITOM 则指用于维持企业日常使用的技术组件、计算需求和业务流程的管理流程和工具。 ITOps 团队负责监督 IT 环境中的服务以及所有资源和 IT 应用的可用性,无论它们属于日常任务还是长期战略规划。 ITOM 是 ITOps 中的一部分,包括用于确保 IT 资源交付的整体质量、效率和最终用户体验的常规流程以及用于实现这一目标的工具。
DevOps 旨在通过自动执行以及整合开发与 IT 运营团队的工作,加速交付更高质量的软件。 通过将这些以前孤岛化的单位衔接起来,组织可以建立以持续沟通、通力协作和共担责任为特色的软件开发和交付流程。 最终可以加快工作流的执行,简化流程,频繁提供创新型新功能,确保卓越的性能和不间断的可用性,满足软件用户不断增长的需求。
在 DevOps 模式中,IT 团队通过提供配置、安装和故障排除支持以及数据库管理和网络基础架构管理,支持软件开发和测试过程。 他们还负责确保基础架构满足开发团队的需求。 为实现此目的,他们可利用应用资源管理 (ARM) 工具,保证应用在需要时获得相应的资源。
在整个 DevOps 生命周期中,IT 和开发团队通常会使用自动化技术来确定依赖关系并测试问题。 DevOps 和 ITOps 使用 应用性能监控 (APM) 和 可观察性 工具,自动分析问题的根本原因,并在部署新代码或更改系统时,在软件交付管道的每一步获得即时反馈。 这种协作使持续交付和部署管道能够平稳高效地运行,加快新应用和增强功能的面市速度。
AIOps 是指应用人工智能 (AI) 能力,例如自然语言处理和机器学习模型,自动执行和简化运营工作流程。 AIOps 不仅为自动化和高效率创造了机会,而且还直接解决了当今 IT 团队面临的重大挑战。 IT 基础架构组件、应用和性能监控工具会生成海量 IT 运营数据 — 随着组织实施 数字化转型 并采用 云计算 服务和混合云环境,这些数据量会迅速飙升。 事实上,Gartner 估计,企业 IT 基础架构平均每年产生的 IT 运营数据都会比上年增加 2 到 3 倍。
为了更好地处理和利用这些数据,IT 运营团队减少了对基于域的 IT 管理工具以及人工监控和干预的依赖,逐渐转向由数据驱动、由 AI 支持的自动化技术。
AIOps 通过在以下方面提供帮助,提高 IT 运营团队的敏捷性和响应速度: