在商业及其他领域,沟通均至关重要。成功的服务级别协议 (SLA) 也遵循此原则,从而为提供商与客户之间的成功关系奠定基础。
服务级别协议 (SLA) 是技术供应商合同的关键组成部分,而它描述了服务提供商与客户之间的服务条款。SLA 描述了预期的性能水平、如何衡量性能以及未达到相关水平时的后果。SLA 可确保所有利益相关者均理解此服务协议,且有助于建立更无缝的工作关系。
SLA 主要有三种类型:
客户级 SLA 定义了服务提供商与客户之间的服务条款。客户既可能为外部客户(例如,从供应商处购买云存储的企业),也可能为内部客户(例如,企业与 IT 团队之间存在涉及产品开发的 SLA)。
向多个客户提供同一服务的服务提供商通常会使用服务级 SLA。服务级 SLA 不会根据客户而改变,而会概述向所有客户提供的一般级别的服务。
当服务提供商为同一产品提供多层定价计划时,他们通常会提供多级 SLA,以便清晰传达每个级别所提供的服务。在两个以上的参与方之间创建协议时,也会使用多级 SLA。
SLA 包括对相关各方的概述、待提供的服务、利益相关者角色细分、绩效监控和报告要求。其他 SLA 组成部分则包括安全协议、补救协议、审查程序、终止条款等。其中至关重要的是,它们定义了如何衡量绩效。
SLA 应精确定义将用于衡量服务绩效的关键指标(服务级协议指标)。这些指标通常与组织的服务级别目标 (SLO)(ibm.com 外部链接)相关。SLA 定义了组织与客户之间的协议,而 SLO 则设定了内部绩效目标。履行 SLA 时需监控与业务运营和服务提供商绩效相关的重要指标。其中的关键在于监控正确的指标。
指标是指用于衡量服务绩效某一方面(例如,可用性或延迟)的具体指标。关键绩效指标 (KPI) 与业务目标相关,它们可用于判断团队实现这些目标的进展情况。没有业务目标,便没有 KPI;后者是反映实现既定目标的进展情况的具体“指标”。
以年销售额增长为例,组织目标为“实现同比增长 30%”。KPI(例如,迄今为止的订阅续订量或产生的潜在客户数)提供了一个实现年度销售增长目标的业务进度的实时快照。
应用程序可用性和延迟等指标有助于提供背景信息。例如,如果组织正在丢失客户,且无法按计划实现年度目标,则对与客户满意度相关的指标(即,应用程序可用性和延迟)进行检视可能会给出针对客户流失原因的部分答案。
SLA 包含不同条款,具体取决于供应商、所提供服务的类型、客户要求、合规标准等,且指标会因行业和用例而异。但是,某些 SLA 性能指标在服务和行业中的使用较为普遍,例如可用性、平均恢复时间、响应时间、错误率以及安全性与合规性衡量标准。这些指标可为运营和所提供服务的质量设定基线。
明确定义哪些指标和关键绩效指标 (KPI) 会用于衡量绩效以及如何传达这些信息,有助于 IT 服务管理 (ITSM) 团队确定要收集和监控哪些数据。有了正确的数据,团队便可更好地维护 SLA 并确保客户确切知晓后续会出现哪些情况。
理想情况下,ITSM 团队除监控与其履行情况相关的指标外,还会在起草 SLA 时提供意见。让 ITSM 团队尽早参与此流程有助于确保业务团队不会与客户达成 IT 团队无法实现的协议。
IT 与 ITSM 领导者需监控的重要 SLA 指标包括:
服务中断或停机的代价高昂,且可能会损害企业信誉并导致合规问题。组织与客户之间的 SLA 决定了服务可用性或正常运行时间的预期水平,同时它也是系统功能的一个指标。
可用性通常会以“通往 100% 路上的各个 9”来衡量:90%、99%、99.9% 等等。很多云提供商和 SaaS 提供商的行业标准目标是实现“5个 9”,即 99.999% 的正常运行时间。
对于某些企业,即便是一个小时的停机时间也可能意味着巨大的损失。如果电子商务网站在黑色星期五等流量高峰时段或大型促销期间出现中断,则可能会损害该公司的声誉和年收入。同时,服务中断也会对客户体验产生负面影响。无法稳定提供的服务通常会导致用户转而寻找其他替代方案。业务需求各有不同,但为用户提供快速、高效的产品与服务的需求却是普遍的共识。
一般来说,正常运行时间最好能达到最长。然而,某些行业的提供商可能会发现,如果在能满足客户需求的前提下提供稍低的可用性比率会更具成本效益。
平均恢复时间可用于衡量在中断或故障期间恢复产品所需的平均时间。没有哪个系统或服务能免遭偶发的问题或故障,但能从中快速恢复的企业更有可能保持业务盈利能力、满足客户需求并遵守 SLA。
SLA 通常会规定服务提供商在某一问题被标记或记录后必须在此期间进行响应的时长。记录问题或发出服务请求时,响应时间表示提供商响应并解决此问题所需的时间。解决时间是指解决此问题所需的时间。尽可能缩短这些时间是保持服务绩效的关键所在。
组织应在问题演变为系统性故障并引发安全或合规问题之前设法将其解决。对于可提供对业务职能的全栈可观察性的软件解决方案,它们在维护优化后的系统与服务性能方面可发挥重要作用。此类平台中有很多均使用了自动化与机器学习 (ML) 工具来自动运行修复流程,或在问题出现之前对其加以识别。
例如,人工智能驱动式入侵检测系统 (IDS) 可持续监控网络流量是否存在恶意活动、违反安全协议的情况或是异常数据。这些系统会部署机器学习算法来监控大型数据集,并使用这些数据集来识别异常数据。异常情况和入侵会触发警报,从而通知 IT 团队。如果缺少 AI 和机器学习,便无法手动监控这些大型数据集。
错误率可衡量服务故障以及服务性能低于既定标准的次数。根据具体企业,错误率可能涉及与业务职能相关的大量问题。
例如,在制造业领域,错误率与特定产品线上的缺陷或质量问题的数量或在设定时间间隔内发现的错误总数相关。这些错误率或缺陷率可帮助组织确定某一错误的根本原因,以及该错误是否与所用材料或更广泛的问题存在关联。
基于客户的部分指标可用于监控客户服务互动,而这些指标也与错误率有关。
大量数据以及对本地服务器、云服务器以及越来越多应用程序的使用会引发更大的数据泄露与安全威胁风险。如果监控不当,安全漏洞和其他漏洞则可能会导致服务提供商面临法律与财务影响。
例如,医疗保健行业对如何存储、传输和处置患者的医疗数据设有特定要求。未满足这些合规标准可能会导致罚款,并需赔偿客户所遭受的损失。
虽然根据所提供服务的不同存在无数种特定于行业的衡量标准,但其中很多标准仍属于较大的广义类别。为取得成功,业务团队和 IT 服务管理团队必须共同致力于改进服务交付并满足客户期望。
监控 SLA 指标是企业衡量 IT 服务能否满足客户期望并确定需改进领域的最有效方法。通过实时监控指标和 KPI,IT 团队可识别系统弱点并优化服务交付。
监控 SLA 指标的主要好处包括:
对业务运营有着清晰的端到端了解有助于 ITSM 团队找到提高绩效的方法。更高的可观察性有助于组织深入了解各项系统和工作流程的运行情况、识别错误、更有效地平衡工作量以及提高绩效标准。
通过监控正确的指标并使用从中收集的洞察信息,组织可提供更优质的服务和应用程序、超越客户期望并推动业务增长。
同样,监控 SLA 指标和 KPI 是确保服务能满足客户需求的最佳方法之一。在竞争激烈的商业领域,客户满意度是提高客户留存率和建立良好声誉的关键因素。
通过明确概述服务条款,SLA 有助于消除混淆并保护各方。精心制定的 SLA 可明确所有利益相关者的期望、提供提供可享受服务的明确时间表,以及哪些利益相关者负责开展具体行动。如果实施得当,SLA 有助于为顺畅的合作伙伴关系定下基调。
IBM Instana Observability 平台和 IBM Cloud Pak for AIOps 可帮助团队从数据中获得更强大的洞察信息,并改善服务交付。
IBM Instana Observability 可实时提供全栈可观察性,从而将自动化、背景信息和智能操作整合到一个平台中。Instana 有助于打破运营孤岛,并提供跨 DevOps、SRE、平台工程和 ITOps 团队的数据访问功能。
IT 服务管理团队可通过能解决事件管理与补救问题的自动化工具从 IBM Cloud Pak for AIOps 中受益。IBM Cloud Pak for AIOps 可提供 IT 运营创新和转型所需的工具。使用高级可视化解决方案(可提供针对跨不同环境的依赖关系的背景信息)来满足 SLA 并监控指标。
IBM Cloud Pak for AIOps 是一个 AIOps 平台,它可提供跨不同环境的绩效数据和依赖关系的可见性。它有助于 ITOps 经理和站点可靠性工程师 (SRE) 使用人工智能、机器学习和自动化功能来更好地解决事件管理与修复问题。借助 IBM Cloud Pak for AIOps,团队可加速创新、降低运营成本并实现 IT 运营 (ITOps) 转型。
IBM web domains
ibm.com, ibm.org, ibm-zcouncil.com, insights-on-business.com, jazz.net, mobilebusinessinsights.com, promontory.com, proveit.com, ptech.org, s81c.com, securityintelligence.com, skillsbuild.org, softlayer.com, storagecommunity.org, think-exchange.com, thoughtsoncloud.com, alphaevents.webcasts.com, ibm-cloud.github.io, ibmbigdatahub.com, bluemix.net, mybluemix.net, ibm.net, ibmcloud.com, galasa.dev, blueworkslive.com, swiss-quantum.ch, blueworkslive.com, cloudant.com, ibm.ie, ibm.fr, ibm.com.br, ibm.co, ibm.ca, community.watsonanalytics.com, datapower.com, skills.yourlearning.ibm.com, bluewolf.com, carbondesignsystem.com, openliberty.io