2026 年可观测性趋势

桌面上摆放着两台显示器,分别显示一组折线图。

2026 年,AI 的持续发展会推动组织升级可观测性策略,让方案更智能、更具成本效益,也更兼容开放标准。

AI 驱动的可观测性工具可以根据采集到的遥测数据自动做出决策,通过生成式 AI 将数据可视化整合到仪表板,并借助机器学习得出的洞察分析结论优化工作流程。AI 带来了新的复杂性,组织需要在成本监控、打破数据孤岛、保障全栈分布式系统兼容与稳定运行等方面格外留意。

因此,2026 年可观测性领域的三大关键趋势是:

  1. 可观测性平台向智能化升级,以跟上 AI 发展的步伐
  2. 将可观测性纳入整体成本管理策略
  3. 开放可观测性标准得到更广泛的采用

随着越来越多的系统开始整合并依赖 AI 驱动的 IT 能力,可观测性平台的智能化升级也将变得至关重要。可观测性智能需要更多使用 AI 驱动的观测工具,本质上,就是用 AI 来监控 AI。

成本管理方面,要在云原生环境中高效部署可观测性工具,就需要重点关注定价方案与兼容性。优化预测与容量规划,紧盯服务级别目标,有助于合理控制支出,避免供应商锁定。

随着 OpenTelemetry (OTel)、Prometheus、Grafana 等开源遥测标准与工具开始适配生成式 AI 工作负载,可观测性的标准化也势在必行。采用统一标准,能让组织将生成式 AI 工具、机器学习模型和 AI 智能体产生的观测数据整合进现有技术堆栈,更全面地展现系统性能与指标。

可观测性的另一大趋势是可观测性即代码。这是一种 DevOps 开发运维 实践,可观测性配置像代码一样统一管理。同时,为了更好地处理日益增多的观测告警,组织也更加重视核心业务功能的可观测性建设。

实现 AI 监控,需提升可观测性的智能化水平

AI 工具需要配套全新的数据采集与使用方式。许多组织都需要彻底革新现有的可观测性体系,确保 AI 工具得到充分理解、高效部署,并与业务目标保持一致。

在可观测性体系中,“智能”既包括从 IT 系统采集遥测数据的基础能力,也包括用这些数据检测异常、分析根本原因、排查故障、优化体验,甚至提前预测并防范问题的能力。

“到 2026 年,生活会有更多场景由 AI 系统承载,而这些系统都运行在基础设施上,可能出现各式各样的故障,”IBM AIOpsInstana 可观测性平台高级技术专员 Arthur de Magalhaes 在接受 IBM Think 采访时表示。

“要让这些 AI 系统稳定运行,所需的智能水平和响应速度也会同步提升,这就要求我们采用更创新、更高效的智能方案。”

de Magalhaes 告诉 IBM Think,2026 年可观测性智能的最大趋势是智能体式 AI 的深度整合,AI 智能体会采集所需的观测数据与洞察分析结论,完成指定任务。例如,专门处理日志的智能体可以分析日志、提取规律、发现异常,再和具备其他能力的智能体配合,完成故障修复与预防,有效缩短平均修复时间 (MTTR)

智能体还可以完成资源扩展、流量重路由、服务重启、部署回滚、暂停数据管道等一系列操作。这些操作会越来越多地按照自动化决策引擎设定的规则执行,引擎会根据业务需求判断问题是否需要处理、该用哪种方式、以及紧急程度。

将这类管理决策交给智能体执行,需要可观测性数据作为支撑依据。有效整合了 AI 智能体的可观测平台,可以自动监测操作结果、调整模型与策略,用最少的人工干预不断优化后续决策。

可观测性将成为成本管理的重要工具

Omdia 于 2026 年 1 月发布的一项研究显示1,55% 的受访企业管理者表示,自己没有足够信息来对技术支出做出有效决策。AI 的发展会让这一问题变得更加复杂。

“提供带 AI 功能服务的企业需要主动监控内部 GPU 成本,动态调整资源规模来匹配需求,同时还要保证盈利,”de Magalhaes 指出。可观测性正是实现这一平衡的关键。

可观测性可以帮助组织评估网络性能,明确 IT 投资的时机和方向。

智能体、大语言模型 (LLM) 等高价 AI 工具大幅推高了图形处理器 (GPU) 需求,组织必须高效配置和使用 GPU,才能让用户流畅使用 AI 服务,尽可能减少中断。可观测性数据可以帮助优化 GPU 的部署与使用,让用户顺畅使用 AI 工具,组织也不会因此亏损或把成本转嫁给用户。

智能体式 AI 也能在这类成本管理中发挥作用。在用例中,专注 AI 可观测的智能体可以分析混合多云环境的数据,优化 GPU 的采购与部署,切实降低成本。

可观测性还能帮助企业管控 IT 其他方面的成本。例如,可以用可观测性工具对比不同的 IT 生态系统配置和网络拓扑,在保证(甚至提升)观测工具性能的前提下,降低观测成本。

容量规划,即用于评估组织的业务承载能力与达成目标所需的资源,依托可观测性工具和监控工具提供的实时洞察分析,也能有效管控成本。

辅以专家洞察分析的最新科技新闻

通过 Think 时事通讯,了解有关 AI、自动化、数据等方面最重要且最有趣的行业趋势。请参阅 IBM 隐私声明

谢谢!您已订阅。

您的订阅将以英语提供。每份时事通讯都包含取消订阅链接。您可以在此管理您的订阅或取消订阅。更多相关信息,请参阅我们的 IBM 隐私声明

IT 行业将采用开放标准

随着技术堆栈里的生成式 AI 模型越来越多,需要一套通用标准将它们与现有的可观测性工具、数据源整合在一起。

可观测性标准化就是为观测数据制定统一的规范与框架,一般通过代码埋点来采集遥测数据。

通用标准能够简化数据摄取、推动行业创新,还能避免供应商锁定。如今很多生成式 AI 工具来自第三方,内部逻辑不透明,却又不断融入云原生 IT 环境,标准化也就变得格外关键。

“社区和企业的应用是可观测性标准化最核心的因素,”de Magalhaes 告诉 IBM Think。“标准先要得到大型社区的认可与使用,之后还要有企业级供应商的完善支持,才能真正落地到实际场景。”

de Magalhaes 表示,OpenTelemetry 将在 2026 年继续强化生成式 AI 的可观测性能力。OTel 的通用数据标准可以让可观测性供应商将黑匣生成式 AI 工具的遥测数据和其他 IT 环境关联起来,形成更完整的端到端视图。

其他可观测性趋势

2026 年的其他重要趋势还包括可观测性即代码的普及,以及对核心业务功能可观测性的重视进一步提升。

可观测性即代码

开放标准的普及和可观测性即代码的应用是同步推进的。

可观测性即代码是一种 DevOps 开发运维实践,它将软件开发的管理思路用到可观测性管理上。与基础设施即代码 (IaC) 类似,可观测性即代码通过配置文件管理观测系统与策略,配置文件通过拉取请求实现版本管理。这些文件用和代码部署一致的标准化流程,代替了人工操作可观测性工具与界面。

de Magalhaes说:“管理基础设施即代码的工具和思路,同样适用于可观测性即代码。”

可观测性即代码可以让自动追踪、部署软件代码的 CI/CD 管道同时管理可观测性,实现遥测数据的自动采集、分析与留存。基于开放标准搭建的环境能让这类配置在各种网络环境中更顺畅地部署和修改。

OaC 环境下生成的配置文件会规定遥测数据的采集、展示与评估方式,比如埋点规则、告警、仪表板和服务级别目标。例如,当 IaC 工具启动新服务器来满足业务需求时,管理员可以自动生成配套配置,直接实现对该服务器的可观测性。

可观测性聚焦关键业务功能

随着可观测性工具功能越来越强、使用越来越广,组织也需要将观测重心放在直接影响业务成果的系统上。

随着时间的推移,系统可观测性的不断提升也会带来警报疲劳加重的问题。根据 Omdia 于 2025 年 11 月发布的研究2,在运营技术这一敏感领域,警报疲劳是网络安全团队最担心的问题,这也说明 IT 团队需要智能、快速地筛选告警,过滤掉无关和冗余的内容。

de Magalhaes 认为,目前最常用的告警优化方式就是只保留影响业务成果的告警。因此,组织可以考虑为网络中直接处理业务运营的部分制定专门的可观测性策略。

例如,站点可靠性工程师 (SRE) 可在异常检测中制定区分规则:若测试环境主机内存不足,则优先级较低;而负责信用卡交易审批的生产环境主机若内存不足,则需立即触发应急响应。

Derek Robertson

Staff Writer

IBM Think

Matthew Kosinski

Staff Editor

IBM Think

相关解决方案
IBM Instana Observability

利用 AI 和自动化的强大功能,主动解决整个应用程序堆栈中的问题。

深入了解 IBM Instana Observability
IBM 可观测性解决方案

借助人工智能驱动的可观测性,最大限度提高运营弹性,并确保云原生应用正常运行。

深入了解 IBM 可观测性解决方案
IBM® Consulting AIOps

使用生成式 AI 增强 IT 自动化和运营,将 IT 基础设施的每个方面与业务优先事项保持一致。

深入了解 IBM Consulting AIOps
采取后续步骤

通过持续集成和交付,释放 DevOps 的潜力,来构建、测试和部署安全的云原生应用程序。

探索 DevOps 解决方案 探索 DevOps 的实际应用
脚注

1.《IT 企业洞察分析:部门 IT 投资重点转型 (2022-2025)》,Omdia,2026 年 1 月 16 日

2.《2026 年值得关注的趋势:新兴网络安全》,Omdia,2025 年 11 月