信息技术运营(通常称为 IT 运营或 ITOps)是实施、管理、交付和支持 IT 服务以满足内部和外部用户的业务需求的过程。
ITOps 是 IT 部门的核心职能,通常向首席信息官汇报。它是 IT 基础架构库 (ITIL) 中定义的四种功能之一(其他三种为技术管理、应用程序管理和服务台管理),ITIL 是 IT 服务管理事实上的行业标准最佳实践框架。
ITOps 处于 IT 服务交付的最前沿,是维持组织正常运转的机器中最重要的齿轮之一。企业及其客户已经变得非常依赖即时访问 IT 服务(数据、软件应用程序、公有云和私有云资源),以至于即使这些服务出现小规模中断,也可能产生深远且代价高昂的后果。
近年来,ITOps 任务越来越多地被 AI 软件承担,形成了 IT 运营的一个新子领域,称为 AI 运营,或简称 AIOps。
自然语言处理 (NLP) 和机器学习 (ML) 模型等 AI 功能正被用于自动化 ITOps 任务,如收集和汇总海量数据,从 IT 运营数据的噪音中分离重要事件警报并确定其优先级,以及关联数据以确定根本原因并提出解决方案。
无论是金融行业、电信行业还是零售业,当今的企业及其客户都依赖于即时访问应用程序并期望获得无缝的客户体验。这就要求应用程序以及应用程序运行所依托的支持性 IT 资源(如公有云和私有云基础设施、数据、网络和服务)发挥最佳性能。即使是短暂的 IT 中断也会对业务运营产生重大影响,并很快变得代价高昂。IT 运营的主要作用是确保 IT 和业务技术的流畅性能,以便业务运营能够不间断地进行。
ITOps 的职责包括:
ITOps 经常与 IT 运营管理 (ITOM) 混淆,因为两者都与保持 IT 服务的正常运行密切相关。ITOps 指与 IT 服务管理相关的人员、角色和任务,而 ITOM 指用于维护企业日常使用的技术组件、计算要求和业务流程的管理流程和工具。ITOps 团队监督 IT 环境中的服务以及所有资源和 IT 应用程序的可用性,无论是日常任务还是长期战略规划。ITOM 是 ITOps 的一个子集,包括确保 IT 资源交付的整体质量、效率和用户体验的常规流程以及用于实现这一目标的工具。
DevOps 开发运维旨在通过自动化并整合开发和 IT 运营团队的工作,来加快更高质量软件的交付。通过将这些以前孤立的单元连接起来,组织可以通过持续沟通、协作和分担责任,构建软件开发和交付流程。最后获得更快的工作流程和简化的流程,满足软件用户对频繁、创新功能以及不间断的性能和可用性不断增长的需求。
在 DevOps 开发运维模型中,IT 团队通过提供配置、安装和故障排除支持、数据库管理和网络基础设施管理,来支持软件开发和测试流程。他们还确保基础设施满足开发团队的需求。实现此目标的一种方法是使用应用资源管理工具,确保应用程序在需要时拥有所需的资源。
在整个 DevOps 开发运维生命周期中,IT 和开发团队都会努力识别依赖关系并测试问题,通常会使用自动化手段。DevOps 开发运维和 ITOps 使用应用程序性能监控 (APM) 和可观测性工具来自动分析问题的根本原因,并在部署新代码或对系统进行更改时,在软件交付管道的每个步骤立即获得反馈。这种协作使持续交付和部署管道能够顺畅高效地流动,从而缩短新应用程序和增强功能的上市时间。
AIOps 是将 NLP 和机器学习模型等 AI 功能应用于自动化和简化工作流。AIOps 不仅为自动化和效率创造了机会,而且还直接解决了当今 IT 团队面临的重大挑战。IT 基础架构组件、应用程序和性能监控工具会产生大量的 IT 运营数据--随着企业进行数字化转型并采用云计算服务和混合云环境,这些数据量会迅速增加。Gartner 估计,普通企业 IT 基础架构每年产生的 IT 运营数据增加了两到三倍。
为了更好地管理和充分利用这些数据,IT 运营团队减少了对基于域的 IT 管理工具以及手动监控和干预的依赖,并越来越多地转向数据驱动、人工智能驱动的自动化。
AIOps 通过辅助以下工作促使 IT 运营团队提高敏捷性和响应能力:
IBM Cloud Infrastructure Center 是一款兼容 OpenStack 的软件平台,用于管理 IBM zSystems 和 IBM LinuxONE 上的私有云基础架构。
发现专为企业混合云和 AI 策略设计的服务器、存储器和软件。
查找适合企业的业务需求的云基础设施解决方案,并按需扩展资源。