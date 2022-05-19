10 秒钟什么时候会变得意义重大？当涉及到应用程序性能时。
对于云原生微服务应用程序来说，10 秒确实很长。
10 秒钟内，应用程序可能发生的情况数不胜数，而且大多数都不是好事。
但是，在深入探讨应用程序可能发生的情况之前，让我们先来看一些真实事件，了解 10 秒钟内会发生什么：
我们特别喜欢 Usain Bolt 的例子，因为在不到 10 秒的时间里，要跑完这么长的距离是很不容易的。
就云原生应用程序的性能和可用性而言，10 秒简直是永恒。交易在互联网上飞速运转，使商业的车轮保持良好的润滑状态。
如果出现问题，10 秒钟内会发生什么？成千上万笔交易可能会出现延迟、崩溃甚至根本无法完成的情况。
遇到这种问题，收入可能会因销售损失而下降。客户会放弃购物车和您的网站，另寻他处购买他们想要的东西。而且，您的品牌形象会受损。
那么，为什么那些捕获指标缓慢，甚至更糟的是对指标和追踪进行采样和聚合的可观测性工具却能被接受呢？这样的平台如何能被视为等同于可观测性平台，例如以现代微服务的速度收集和情境化信息的 IBM Instana® 平台。在获得解决问题所需的信息之前，它们会使上述问题长期存在。
对于 PRISA Tecnologia 来说，性能是关键。当他们遇到性能问题时，会对企业的业绩和消费者对其品牌的认知产生直接且不利的影响。
“显示内容时一秒的时间差会对受众的体验产生巨大影响。”– PRISA Tecnologia 的 IT 架构、运营、安全和工作场所总监 Jorge Tomé Hernando
与 Instana 平台超精确的一秒指标间隔相比，Instana 平台的主要可观测性竞争对手要么以 10 秒的间隔对指标进行采样，要么以一分钟或更长的间隔对指标进行聚合。Instana 平台还能在三秒钟内发出问题通知。此处显示的可观测性检测间隙图说明了这种响应。
您真的能等待 10 秒甚至长达一分钟的时间，让可观测性平台告诉您存在问题吗？如果是人工排查，也许可以。但是，使用自动化甚至半自动化修复方法就不行了。
对于所有应用程序来说，速度和可靠性是目标。为了实现更好的应用程序性能和可靠性，必须改变“始终需要人工修复问题 (MTTR)”的首要战略。通过人为干预来修复补救措施将导致人力资源负担过重并限制变革的步伐。它还会降低服务级别指标 (SLI)。
“借助 Instana，我们的日常目标是保证延迟预期。我们的服务调用目标是不超过 250 毫秒。这不仅用于防灾演习。我们能在日常工作中改善性能，促使我们朝着 250 毫秒的目标前进。Instana 使之成为可能。”– Dealerware 首席平台架构设计师 Bryce Hendrix
为了提高性能和可用性，自动化 AIOps 是未来的发展方向。自动化 AIOps 可提供与 AIOps 相结合的额外自动化功能，这是实现更高性能和可用性的前进方向。如何实现呢？通过让自动化 AIOps 解决那些机器能够比人类更快、更完美地修正的问题。在人类干预之前，机器就可以修复和预防许多有关基础设施资源分配及其他的问题。
这些优势是否意味着所有应用程序问题都可以通过自动化 AIOps 解决？当然不是。
有很多复杂的逻辑问题（比如代码问题等）只有人工排查才能解决。但在许多问题上，自动化 AIOps 速度更快、效率更高，应该成为问题修复的首选解决方案。
以平均预防时间 (MTTP) 为例，它被定义为可观测性加上 AIOps 防止问题对混合云应用程序和基础设施产生负面影响所需的时间。
自动化 AIOps 为应用程序问题修复连续性提供了一个新选项。上图说明了从全自动问题修复到人工 MTTR 基本要素的连续性。
在这种连续性中，可观测性是每种修复类型的起点。可观测性平台检测到问题所需的时间越长，开始修复过程所需的时间就越长。这种时间差意味着，当添加自动化 AIOps 时，一秒检测和十秒或更长时间检测之间的差异将变得巨大。如果应用程序可以等待 10 秒以上才能检测到问题，那么为什么还要使用自动化 AIOps 呢？
自动化 AIOps 修复是未来的发展趋势。这是提高应用程序性能和弹性的下一个合乎逻辑的步骤。基础架构性能问题通常比微服务代码问题更重要，并且这种情况将继续存在。
应用程序问题检测和修复的新黄金标准将是自动化可观测性加上 AIOps。二者结合使用有助于确保问题不会演变成大问题。
如果您想充分发挥自动化 AIOps 修复的优势，则需要高频、超精确的指标和跟踪数据来为 AIOps 引擎提供信息。而且，您只需花费较慢的可观测性技术的一小部分成本即可获得它们。
10 秒钟确实可以发生很多事情。借助实时指标和自动化 AIOps，您可以确保应用程序不会出现不良问题。
