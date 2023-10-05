SLO 是使用服务级别指标 (SLI) 来衡量的，SLI 是服务某些方面的定量指标。SLO 是服务提供商和客户之间更广泛协议的一部分，该协议称为服务级别协议 (SLA)，其中概述了客户可以从提供商处获得的服务级别，并规定了如果未能达到目标将受到的处罚。



为了确保服务级别与业务需求和客户需求保持一致，站点可靠性工程 (SRE) 团队、开发运维、IT 和其他相关团队必须了解每个应用程序的关键用户旅程：即支持最终用户获得预期结果的交互。

内部支持对于成功的 SLO（因此也是 SLA）至关重要，多个利益相关者应参与确定 SLO，包括产品经理、开发运维和问题管理团队以及基础设施工程师。外部客户通过焦点小组、研究、客户投诉和社交媒体来参与讨论。

SLO 的关键逻辑是服务可靠性会提升用户满意度，从而带来更大的商机。建立可衡量的可靠性目标有助于组织在愉悦高效的用户体验与合理成本之间取得平衡：超出所需或预期的服务级别不会超出 IT 预算。

SLO 是必要的，因为它们以具体、可衡量的客观术语定义了服务质量 (QoS) 和可靠性目标。它们的目的不是确定最佳性能水平，而是确定可能达到和最不可接受的性能标准的范围。1

O'Reilly Media 的 97 Things Every Cloud Engineer Should Know（每个工程师都应该知道的 97 件事）（ibm.com 外部链接）很好地总结了 SLO 的目标：“如何为管理层提供一种简单的方法，让他们立即了解可靠性、创新速度和成本之间的权衡？SLO 就是答案。SLO 制定了明确的可靠性准则，在云成本、变更速度和外部风险之间取得平衡。”