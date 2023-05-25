如果您是一位 IT 专业人员——无论您是高管还是动手实践的工程师——您都清楚您的 IT 运维所承受的压力。您肩负着优化支出、提升运营效率以及引入创新技术的责任。但您使用的工具是否在拖慢您的脚步？
AIOps（IT 运维人工智能）这一术语由研究机构 Gartner 提出。它是指将人工智能 (AI) 功能（例如，自然语言处理和机器学习模型）应用于自动化和简化运维工作流。
在这篇博客文章中，我们将通过数据驱动自动化的视角审视传统的 IT 运维问题，并探讨 AIOps 的优势。这是解决应用程序性能欠佳、客户体验不佳等关键问题，提升如平均修复时间 (MTTR) 等指标，并应对 IT 团队技能挑战以增强系统弹性的有力途径。
我们将向您展示，由 AI 驱动的解决方案如何帮助您的 IT 团队从“故障修复”模式转向一个更预测性、更主动的模式。这一模式旨在应对动态挑战，实现更快的问题修复，为您的组织带来切实的底线效益，并助您实现数字化转型。
云服务、微服务、 容器及混合云环境的激增，可能导致传统 IT 运维团队难以监控和管理这些复杂环境中的潜在问题。其结果是产生监控盲点、虚假警报，以及问题识别与解决的延迟。而每一秒都至关重要——IDC 近期的一项调查发现，当创收性生产服务受影响时，每小时的停机成本平均高达 25 万美元或更多。
借助 AIOps，您可以利用可观测性工具的优势，为所有应用相关方提供近乎实时的数据粒度与基数。更好的可见性、沟通与透明度意味着团队能够以更敏捷、更快速响应的方式精准定位问题。例如，Enento Group 在对现有本地系统进行现代化改造时，就利用可观测性技术在一处集中监控其所有应用程序。这种方法使他们能够满足服务级别协议 (SLA)，并实现 99.99% 的可用性。
当今复杂多样的网络也同样受益于 AIOps 和实时性能监控。BT Business 实现了全新水平的可见性，并将监控系统数量整合减少了 80%。这不仅使集成更简便，还大幅降低了软件许可成本。
平均而言，各组织在混合云环境中使用的应用程序超过 1,000 个。同时，我们正淹没在数据的海洋中，但企业数据中被利用的甚至不足三分之一。传统 IT 基础设施无法跟上分析所有信息的步伐，这意味着即使有可能，也难以发现改进与创新的机会。
AIOps 的优势在于，您拥有能够穿透 IT 噪声，同时关联来自多个 IT 环境运维数据的工具。这意味着您可以进行异常检测、执行根本原因分析并提出解决方案，其速度与准确性都超越人力所能及。IT 团队可以从修复工作转向部署工作，为业务交付更大价值。例如，ExaVault 选择了一套可观测性解决方案，用以即时洞察应用程序性能问题，将 MTTR 降低了 56.6%。
传统 ITOps 管理应用的常见做法，往往是在云上过度支出以规避性能风险。难怪各组织表示，其在 2022 年有 32% 的云支出被浪费了。但在当下，每一分钱都至关重要，这种浪费性支出也会对环境产生影响。
AIOps 的优势在于能够通过软件（而非人工干预）做出关键决策，优化云成本。应用程序能够在需要时，持续且自动地获得其恰好所需的资源。例如，Providence 在短短 10 个月内，安全地将其大部分工作负载迁移至 Azure，并通过优化行动实现了超过 200 万美元的成本节约——这一切都是在确保应用性能（即使在需求高峰期间）的前提下完成的。
数据中心占全球用电量的 1% 至 1.5%。如上文所述，IT 团队过度分配资源以缓解应用程序性能风险的情况并不少见。然而，这种传统方法既损害企业利益，也损害环境，并且客户正在关注您对 ESG 承诺的重视程度。根据 Nielsen 的数据，75% 的千禧一代愿意改变购买习惯，转而选择环保产品。
在可持续发展方面，AIOps 工具使您能够实施 FinOps 云财务管理规范，并自动优化您的云和数据中心环境。这反过来减少了能源消耗，降低了闲置机器产生的浪费。例如，BlueIT 在转向 AIOps 后，减少了其客户环境中的浪费。在执行了由人工智能驱动的资源建议后，一位客户成功将其内存和 CPU 的过度分配减少了 10%。
寻找、留住并培训合适的 IT 人员是一项首要问题。由于自动化和新技术的发展，预计到 2025 年，50% 的员工需要提升技能或学习新技能。传统 ITOps 过于依赖个人的人工干预、手动努力（如追查故障）或基于过往有效经验的组织内部知识。
AIOps 的优势在于，它让员工能够使用持续学习的工具，确保知识不会因人员退休而流失。由人工智能驱动的主动事件管理有助于识别误报，并优先处理最紧急的警报。这使 IT 团队有能力在潜在问题导致运行缓慢、服务中断或客户体验不佳之前就予以解决。
例如，Electrolux 通过更快的平均检测时间 (MTTD)，将 IT 问题解决周期从三周加速至仅一小时，并通过自动化修复任务每年节省了超过 1,000 小时。
随着我们的系统日益复杂，IT 挑战（以及您将面临的压力）肯定不会减少。但通过采用 AIOps 解决方案（及其带来的 AIOps 优势）来升级您的 IT 运维，您将获得由人工智能驱动的自动化能力，构建起能够实现秒级响应的 IT 体系，减少停机时间，提升应用程序性能，降低运营成本，并取得更大的数字化转型成功。
探索 IBM AIOps 解决方案，了解 AI 和 IT 如何协同提供数据驱动洞察，助力 IT 领导者推动卓越业务表现。
IBM® Granite 是我们开放式、性能优异、值得信赖的 AI 模型系列，专门为企业量身定制，并经过优化，可以帮助您扩展 AI 应用。深入了解语言、代码、时间序列和防护措施选项。
使用面向 AI 构建器的新一代企业级开发平台 IBM watsonx.ai，可以训练、验证、调整和部署生成式 AI、基础模型和机器学习功能。使用一小部分数据，即可在很短的时间内构建 AI 应用程序。
借助 IBM 业界领先的人工智能专业知识和解决方案组合，让人工智能在您的业务中发挥作用。
通过增加 AI 重塑关键工作流程和运营，最大限度提升体验、实时决策和商业价值。