SLA(서비스 수준 계약)란 무엇인가요?

기어, 로봇 팔, 휴대폰 픽토그램이 콜라주된 일러스트

게시일: 2024년 5월 30일
기고자: Michael Goodwin

SLA란 무엇인가요?

서비스 수준 계약(SLA)은 서비스 제공업체와 고객 간의 계약으로, 제공될 서비스와 예상되는 성능 수준을 정의합니다. 또한 SLA는 성과를 측정하고 승인하는 방법과 성과 수준이 충족되지 않을 경우 어떤 일이 발생하는지도 설명합니다.

SLA는 일반적으로 공급업체와 외부 고객 간에 이루어지지만, 회사는 부서나 팀 간의 계약을 공식화하기 위해 내부적으로도 SLA를 사용합니다.

SLA는 아웃소싱 및 IT(정보 기술) 공급업체 계약의 중요한 부분으로, 작업 관계에 대한 엔드투엔드 뷰를 제공합니다. 이는 모든 이해관계자가 서비스 계약을 정확하게 이해하는 데 도움이 됩니다.

SLA는 고객의 기대치를 설정하고, 제공업체에 책임을 부여하며, 궁극적으로 최종 사용자 경험을 최적화하는 데 도움이 됩니다. SLA는 보다 원활한 업무 관계를 위한 기반을 마련하고 불확실성과 논쟁 지점을 처음부터 해결하며 관련된 모든 당사자의 이익을 보호하는 데 도움이 됩니다.

SLA 유형

서비스 수준 계약에는 고객 수준(고객 기반 SLA라고도 함), 서비스 수준 및 다중 수준 SLA의 세 가지 주요 유형이 있습니다.

고객 수준 SLA

고객 기반 SLA는 고객이 외부 고객이든 내부 고객이든 관계없이 서비스 제공업체와 고객 간의 계약입니다. 본 계약은 고객에게 제공될 서비스 또는 기타 서비스에 대해 설명합니다. 예를 들어, 이 계약은 타사 클라우드 서비스 제공업체와 기술 회사 간에 체결될 수 있으며, 클라우드에서 호스팅되는 애플리케이션의 성능 기대치를 간략하게 설명합니다.

내부 SLA는 동일한 조직 내의 서로 다른 두 부서, 팀 또는 사이트 간의 계약입니다. 이 계약은 개발 팀과 비즈니스 팀 간에 이루어질 수 있으며, 특정 애플리케이션 또는 제품에 대한 배포 주기와 전반적인 기대치를 간략하게 설명합니다.

서비스 수준 SLA

서비스 수준 SLA는 여러 고객에게 제공되는 정의된 서비스를 자세히 설명하는 계약입니다. 제공업체가 어떤 고객이든 관계없이 동일한 수준의 서비스 및 지원을 제공하는 경우 서비스 수준 SLA를 사용할 수 있습니다.

예를 들어 IT 서비스 관리 (ITSM) 팀은 모든 고객을 대상으로 서비스 지원을 요청하거나 인시던트를 보고하기 위해 회사에 문의할 때 서비스 데스크에서 기대할 수 있는 서비스 수준을 설명하는 공통 SLA를 사용할 수 있습니다.

다중 수준 SLA

다중 수준 SLA는 둘 이상의 당사자 또는 서로 다른 수준의 서비스를 동일한 계약에 통합하기 위한, 여러 수준으로 분할되어 있는 계약입니다. 다중 수준 SLA는 여러 외부 공급자와 조직 간에 사용될 수 있으며, 여기에는 다수의 퍼블릭 클라우드 공급업체가 있는 멀티클라우드 모델이 포함됩니다. 계약은 두 개 이상의 내부 팀 또는 부서 간에 설정할 수도 있습니다.

예를 들어 SaaS 제품과 같이 다양한 요금제 또는 서비스 수준의 제품을 제공하는 조직에서는 각 제품 계층에 대한 서비스 수준 및 기대치를 설명하는 다중 수준 SLA를 사용할 수도 있습니다.

SLA의 구성 요소

SLA는 회사, 제품 및 각 조직의 특정 비즈니스 요구 사항에 따라 다르지만, 대부분의 SLA에는 유사한 특징이 포함되어 있습니다. 주요 구성 요소는 다음과 같습니다.

개요

개요 섹션에서는 계약과 관련된 당사자, 제공될 서비스의 대략적인 개요, 계약 시작일 및 기간 등 계약의 가장 기본적인 특징을 소개합니다.

서비스 설명

서비스 설명 섹션에서는 제공되는 특정 서비스 및 모든 관련 세부 정보를 설명합니다. 여기에는 서비스 제공, 결과물 처리 시간, 유지 관리 일정, 관련 종속성 및 기타 관련 정보에 대한 정보가 포함됩니다. 이 섹션에서는 모든 요소와 상황에 대한 철저한 설명을 제공해야 합니다.

이해관계자 분석

이해 관계자 섹션에는 계약에 관련된 모든 당사자, 그들의 역할과 책임, 연락 방법이 나열되어 있습니다. 기본 연락처는 최종 사용자 문제 보고를 위한 연락 담당자로 지정되는 경우가 많습니다.

성과 추적 및 보고

성능 섹션에서는 합의된 서비스 가용성 및 서비스 성능 표준과 성능을 측정하는 데 사용할 메트릭에 대해 자세히 설명합니다. 이는 일반적으로 특정 서비스에 대해 일정 기간 동안 합의된 성과 목표를 설정하는 SLA 내 계약인 서비스 수준 목표(SLO)에서 정의됩니다.

여기에는 정보를 수집하고 이해 관계자와 공유하는 방법을 설명하는 워크플로가 포함되는 경우가 많습니다. 성과 수준과 성과 측정에 사용되는 메트릭은 전체 계약의 핵심이므로 모든 당사자가 신중하게 고려해야 합니다.

제외 사항

이 섹션에는 계약에서 면제되는 서비스 또는 서비스 제공의 여러 측면이 나열되어 있습니다. 이 섹션에서는 고객의 장비 문제 또는 합리적인 통제 범위를 벗어난 요인(불가항력)으로 인한 다운타임은 제외됩니다. 또한 예약된 유지 관리에 대한 예외를 포함할 수 있으며, 해당 기간은 보장된 가동 시간 계약에 포함되지 않습니다.

보안 프로토콜

보안 섹션에서는 제공업체가 유지 관리하는 보안 프로토콜 및 표준을 설명하고 제공업체가 고객 데이터를 보호하는 방법에 대한 정보를 제공합니다. 또한 기밀 유지 계약(NDA) 및 민감한 정보나 지적 재산 보호와 관련된 모든 조치가 나열되어 있습니다.

수정

이 섹션에서는 양 당사자가 계약 조건을 이행하지 않을 경우 받게 되는 벌금을 정의합니다. 여기에는 에스컬레이션 절차, 해결 기간, 서비스 제공업체가 SLA 조건을 이행하지 않을 경우 제공해야 할 보상이 자세히 설명되어 있습니다. 보상은 금전적 보상, 서비스 크레딧 또는 다른 것일 수 있습니다.

또한 이 섹션에는 서비스 제공자가 정의된 기간 동안 표준 서비스 수준을 충족하거나 초과하여 서비스 크레딧을 다시 얻을 수 있도록 하는 조항인 적립 환급과 같은 상환 조건이 나열되어 있습니다.

면책 조항

면책 조항은 위험을 고객에서 서비스 제공업체로 전가하여 고객을 보호하는 SLA 계약의 구성 요소입니다. 면책 조항은 서비스 보증 위반으로 인해 발생하는 제3자 소송 비용, 손실 또는 손해에 대해 서비스 제공업체가 고객에게 배상(피해 보상)하는 데 동의하는 조항입니다.

이러한 조항이 계약서, 특히 표준화된 SLA 템플릿에 항상 존재하는 것은 아니지만, 고객은 법률 고문의 도움을 받아 이를 추가할 수 있습니다.

검토 및 조정 프로세스

공급업체의 역량, 워크로드 및 고객 요구 사항은 시간이 지남에 따라 진화합니다. 따라서 합의된 조건과 성과를 측정하는 데 사용되는 KPI를 검토하고 수정하기 위한 프로세스와 일정이 확립되어 있어야 합니다. 이러한 검토를 통해 SLA는 공급업체 제품 또는 서비스의 최신 기능을 통합하고 현재 고객 요구 사항을 해결할 수 있습니다.

해지 절차 및 약관

계약서에는 만료일 이전에 서비스 계약을 해지할 수 있는 상황과 그러한 조치를 취할 경우 각 당사자가 요구하는 통지 기간을 명시하는 섹션이 포함되어야 합니다.

서명

계약은 양측의 승인된 이해 관계자가 서명하며, 계약이 유효한 동안 관련된 모든 당사자는 계약 조건에 구속됩니다.

KPI 및 SLA

SLA는 공급업체와 고객 간에 합의된 서비스 표준을 명시하는 계약입니다. KPI는 공급업체가 이러한 목표에 대한 성과를 측정하고 팀이 지속적으로 개선할 수 있도록 하는 데 사용하는 척도입니다. KPI는 평가 프로세스를 간소화하고 팀이 명시된 목표를 향해 어떻게 성과를 내고 있는지 정확하게 파악할 수 있도록 설계되었습니다.

예를 들어, 조직이 서비스의 사이버 보안에 대해 특정 보장을 한 경우, 지정된 기간 동안의 보안 인시던트 수, 침입 시도 횟수 및 침입 탐지 또는 방지 시스템의 성공률, 인시던트당 비용 또는 공급업체 보안 등급과 같은 KPI를 추적할 수 있습니다.

기업이 고려해야 할 SLA 메트릭은 무엇인가요?

서비스 수준 목표(SLO)는 오류율, 요청 지연 시간 또는 가동 시간 등 서비스의 특정 측면에 대한 성능 기준을 설정하는 SLA의 일부입니다. 성능 메트릭 및 KPI는 제공된 서비스 품질을 평가하고 서비스 제공업체가 SLA 조건을 충족하는지 확인하는 데 사용됩니다. 

적절한 메트릭을 모니터링하는 것은 SLA의 성공에 있어 중요한 부분입니다. 올바른 데이터가 없으면 어느 한 당사자도 계약이 자신에게 어떻게 도움이 되는지 알기 어렵습니다. 그리고 너무 많은 메트릭을 추적하면 이해하기가 어려워 혼란이 발생할 수 있습니다. 서비스마다 추적해야 할 메트릭이 다르지만 일반적인 SLA 메트릭은 다음과 같습니다.

가용성 및 가동 시간

작동 시간은 서비스가 제대로 작동하고 사용할 수 있는 시간입니다. 이 메트릭은 일반적으로 일정 기간 동안의 백분율로 제공됩니다(예: 30일당 99.5%(3.6시간의 다운타임)). 가동 시간 요구 사항은 비즈니스 유형에 따라 다르며 SLA에 반영됩니다.

예를 들어, 한 달에 3.6시간의 다운타임은 전 세계적으로 비즈니스를 운영하는 전자 상거래 플랫폼의 경우 너무 큰 부담일 수 있습니다. 이러한 회사는 더 큰 가용성 보장이 필요할 수 있으며 이를 반영하는 SLA를 모색할 것입니다.

오류율

오류율은 생산 또는 서비스 장애와 IT 서비스 제공업체의 서비스 수준이 예상 성과 목표 이하로 떨어지는 시간 비율을 추적하는 측정값입니다. 계약에는 마감일 미준수, 기능 또는 업데이트 릴리스 지연, 부정적인 헬프데스크 지원, 코딩 오류율, 결함률 및 기타 기술 품질 측정 등에 대한 SLO가 포함될 수 있습니다.

응답 시간

응답 시간은 제공업체가 클라이언트 문제나 요청을 기록하고 응답하는 데 허용되는 시간을 설정합니다.

해결 시간

해결 시간은 제공업체가 문제를 기록한 후 문제를 해결하는 데 허용되는 시간을 설정합니다.

평균 복구 시간

이 메트릭은 장애나 중단 후 제품, 서비스 또는 시스템을 복구하는 데 걸리는 평균 시간입니다.

최초 통화 해결률

이 메트릭은 서비스 데스크 또는 채팅 봇과 처음 상호 작용하는 동안 제공업체가 문제를 해결한 고객의 비율을 측정한 것입니다.

이탈률

이는 고객 서비스 제공업체 또는 고객 서비스 구성 요소가 있는 조직에게 중요한 메트릭입니다. 고객이 헬프 데스크로부터 답변을 받기 전에 고객 지원 문의를 포기한 비율입니다.

보안

공개되지 않은 취약성, 바이러스 백신 업데이트 또는 소프트웨어 패치와 같은 다양한 보안 조치를 측정하여 IT 보안에 대한 공급업체의 노력을 평가할 수 있습니다.

비즈니스 결과

적절한 메트릭 및 KPI를 사용함으로써 조직은 공급업체의 서비스나 제품이 더 광범위한 비즈니스 목표에 어떻게 기여하고 있는지 확인할 수 있습니다. 예를 들어, 디지털 혁신을 진행 중인 기업은 공급업체의 클라우드 리소스 툴이 클라우드 컴퓨팅 지출을 다시 관리하는 데 도움이 되는지 질문할 수 있습니다. 올바른 데이터를 추적하면 이 질문에 답하는 데 도움이 됩니다.

SLA의 이점

SLA는 서비스 제공업체와 고객 모두에게 이점을 제공합니다. SLA가 도움이 되는 부분:

서비스 품질 및 고객 경험 개선

조직은 SLA를 작성할 때 제품, 서비스, 프로세스 및 관련 고객 경험을 면밀히 검토하여 무엇이 잘 작동하고 무엇이 개선될 수 있는지 판단할 수 있는 기회를 갖게 됩니다. SLA는 성과 및 고객 경험 성공을 측정하기 위한 벤치마크를 제공하는 명확한 성과 목표를 수립합니다.

용이한 커뮤니케이션

SLA는 문제 해결 및 분쟁 처리를 위한 프로세스와 채널뿐만 아니라 모든 이해관계자의 역할과 책임을 명확히 합니다. 이러한 명확성은 혼란을 없애고 내부 및 외부 고객과의 명확한 의사소통을 촉진하는 데 도움이 됩니다.

서비스 연속성 향상

SLA는 서비스 가용성에 대한 기대치를 정의하고, 다운타임에 대한 정책을 설정하며, 장애 및 재해 복구에 대한 절차를 마련합니다. 이러한 조치는 중단 및 예상치 못한 가동 중지 시간을 최소화하고 기술 문제 및 서비스 중단을 신속하게 해결하는 데 도움이 됩니다. 만족스러운 프로세스가 마련되면 조직은 자동화를 활용하여 서비스 일관성을 향상할 수 있습니다.  

위험 최소화

SLA 프로세스는 위험 관리에 선제적으로 대응할 수 있는 기회를 제공합니다. 이 프로세스는 잠재적인 위험과 위협을 미리 식별하고 비즈니스 이해관계자가 이러한 문제를 방지하거나 완화하기 위한 계획을 개발하는 데 도움이 됩니다. 조직은 서비스 제공 및 대응 시간을 개선하고, 더 강력한 비상 계획을 수립하고, 전반적인 위험 관리 전략을 강화할 수 있습니다.

관련 솔루션
IBM Instana Observability

누구나 필요한 컨텍스트와 함께 원하는 데이터를 얻는 데 사용할 수 있는 솔루션으로 관측 가능성을 민주화합니다. 클라우드 네이티브용으로 구축되었지만 기술에 구애받지 않는 IBM Instana Observability 플랫폼은 모바일, 웹, 애플리케이션 및 인프라 전반에 걸친 논리적, 물리적 종속성의 컨텍스트에서 고충실도 데이터(1초 단위 세분화 및 엔드투엔드 추적)를 자동으로 지속적으로 제공합니다.

IBM Instana Observability 살펴보기 Instana 데모 요청하기

IBM Instana 애플리케이션 인시던트 해결

끊임없이 변화하는 오늘날의 디지털 환경에서 IT 운영은 애플리케이션 데이터의 방대한 양과 복잡성이라는 전례 없는 어려움을 마주하고 있습니다.Instana 인시던트 해결 자동화 기능을 사용하면 신속한 인시던트 관리와 효율적인 문제 해결을 통해 애플리케이션 가동 중단 시간을 거의 제로에 가깝게 줄일 수 있습니다.

Instana 애플리케이션 인시던트 해결 살펴보기 기술 미리 보기 신청

AIOps용 IBM Cloud Pak

환경 전반에 걸쳐 성능 데이터와 종속성에 대한 가시성을 제공하는 AIOps 플랫폼으로 변화하는 환경에서 보다 신속하게 혁신을 이루고 운영 비용을 절감하며 IT 운영(ITOps)을 혁신할 수 있습니다.

Cloud Pak for AIOps 살펴보기
리소스 IT 서비스 관리(ITSM)란 무엇인가요?
최종 사용자의 요구 사항을 충족하고 조직이 비즈니스 목표를 달성할 수 있도록 정보 기술 서비스를 계획, 구현, 관리 및 최적화하는 방법을 살펴보세요.
IT 인프라 라이브러리(ITIL)란 무엇인가요?
ITIL(정보 기술 인프라 라이브러리)이 조직에 필수적인 이유와 인증이 여러분과 회사에 어떤 이점을 제공하는지 알아보세요.
개발자를 위한 관측성
소프트웨어 아키텍처 패러다임이 모놀리스에서 마이크로서비스로 발전함에 따라 개발자가 프로그램 배포 후에도 더 많은 책임을 수행하는 데 관측성이 어떻게 도움이 되는지 알아보세요.
사이트 안정성 엔지니어링(SRE)이란 무엇인가요?
사이트 안정성 엔지니어링을 통해 IT 운영 작업을 자동화하고, 소프트웨어 제공을 가속화하고, IT 위험을 최소화할 수 있습니다.
생성형 AI란 무엇인가요?
때로 gen AI라고 불리기도 하는 생성형 AI는 사용자의 프롬프트 또는 요청에 따라 텍스트, 이미지, 비디오, 오디오 또는 소프트웨어 코드와 같은 독창적인 콘텐츠를 생성할 수 있는 인공 지능(AI)입니다.
Instana로 가동시간 최적화
고객을 위해 연간 20억 개 이상의 파일 전송을 처리하는 Exavault가 Instana를 통해 평균 해결 시간(MTTR)을 56% 단축할 수 있었던 방법을 알아보세요.
다음 단계 안내

IBM Instana는 모두가, 그리고 누구나 활용할 수 있는 실시간 관측성을 제공합니다. 가치 실현 시간을 단축하는 동시에 관측성 전략이 현재 및 미래 환경의 역동적인 복잡성을 따라잡을 수 있는지 검증해 줍니다. Instana는 모바일에서 메인프레임에 이르기까지 250여 개 기술을 지원하고 있으며 그 수는 점차 늘어나고 있습니다. 

IBM Instana 살펴보기 라이브 데모 예약하기