백업과 재해 복구란?
가동 중단 시간을 최소화하는 효과적인 계획을 수립할 수 있도록, 백업 및 재해 복구의 기초 지식에 대해 알아봅니다.
검은색과 파란색 배경
백업과 재해 복구란?

가동 중단 시간을 최소화하는 효과적인 계획을 수립할 수 있도록, 백업 및 재해 복구의 기초 지식에 대해 알아봅니다.

  • 백업과 재해 복구의 차이점을 알아보고 효과적인 전략을 개발하는 데 필수적인 주요 개념을 이해합니다.

  • 여러 클라우드 및 온프레미스 배포 옵션을 평가하여 조직에 가장 적합한 옵션을 찾습니다.

  • 백업 및 재해 복구 목표를 달성하는 데 가장 좋은 기술을 찾아냅니다.

백업 및 재해 복구의 핵심을 파악하는 것은 비즈니스에서 계획되지 않은 다운타임의 영향을 최소화하는 데 매우 중요합니다. 여러 산업에서 조직들은 다운타임으로 인해 순식간에 수익 손실이 발생할 수 있다는 것을 인식하고 있습니다. 안타깝지만, 자연 재해, 인적 오류, 보안 침해, 랜섬웨어 공격은 모두 IT 리소스의 가용성을 위협할 수 있습니다. 다운타임은 언제든 고객과의 상호작용을 방해하고, 직원 생산성을 저해하고, 데이터를 파괴하고, 비즈니스 프로세스를 중단시킬 수 있습니다.

백업을 재해 복구와 구분하고, 주요 용어를 정의하고, 다양한 배포 옵션과 기술을 평가하면 다운타임의 부정적 영향을 방지하기 위한 효과적인 전략을 개발하는 데 도움을 받을 수 있습니다.

백업 및 재해 복구란 무엇일까요?

백업과 재해 복구 사이에는 중요한 차이가 존재합니다. 백업은 데이터의 복제본을 하나 또는 여러 개 만드는 프로세스입니다. 데이터를 보호하기 위해 백업을 수행합니다. 데이터가 실수로 삭제되거나, 데이터베이스가 손상되거나, 소프트웨어 업그레이드 동안 문제가 발생하면 백업 데이터를 복원해야 할 수 있습니다.

한편, 재해 복구는 운영 중단 후 애플리케이션, 데이터, IT 리소스에 대한 액세스를 신속하게 회복하기 위한 계획 및 프로세스를 말합니다. 재해 복구를 위해서는 기본 데이터 센터가 다시 기능할 때까지 이중화된 서버와 스토리지 시스템으로 전환해야 할 수 있습니다.

백업을 재해 복구로 오해하는 조직도 있습니다. 그러나 심각한 운영 중단을 겪은 후에는 알게 되겠지만, 데이터 복제본이 있다고 해서 비즈니스를 계속 운영할 수 있는 것은 아닙니다. 비즈니스 연속성을 유지하려면 테스트를 거친 견고한 재해 복구 계획이 필요합니다.

계획의 중요성

여러분의 조직은 백업 또는 재해 복구를 소홀히 할 여유가 없습니다. 우발적으로 데이터가 삭제된 후 손실된 데이터를 복구하는 데 몇 시간이 걸린다면 직원과 파트너는 해당 기술에 의존하는 비즈니스 크리티컬 프로세스를 완료하지 못한 채 그냥 앉아 있을 것입니다. 그리고 재해 이후 비즈니스를 다시 온라인 상태로 되돌리는 데 며칠이 걸린다면 영원히 고객을 잃게 될 것입니다. 이 두 사례에서 손실된 시간과 비용을 생각해 보면 백업과 재해 복구에 대한 투자는 완벽하게 정당화됩니다.

주요 용어

몇 가지 필수 용어를 이해하면 전략적 의사 결정을 내리는 데 도움이 될 수 있고 백업 및 재해 복구 솔루션을 더 효과적으로 평가할 수 있습니다.

  • 복구목표시간(Recovery Time Objective, RTO)은 운영 중단 이후 정상적인 비즈니스 운영을 복구하는 데 걸리는 시간입니다. RTO를 설정하려고 할 때 얼마만큼의 시간을 잃을 수 있는지, 그리고 이 손실된 시간이 수익에 어떤 영향을 주는지 고려해야 합니다. RTO는 비즈니스 유형에 따라 크게 달라질 수 있습니다. 예를 들면, 공공 도서관의 카탈로그 시스템에 문제가 생길 경우 시스템이 복구되는 동안 며칠 정도 수동으로 계속 기능할 수 있습니다. 그러나 주요 온라인 소매업체의 재고 시스템에 문제가 생기면 10분이라도 다운타임과 이로 인한 수익 손실은 허용되지 않을 것입니다.
  • 복구목표시점(Recovery Point Objective, RPO)은 재해 발생 시 잃어도 되는 데이터의 양입니다. 운영 중단 시 데이터가 전혀 손실되지 않도록 하려면 계속적으로 원격 데이터 센터에 데이터를 복제해야 할 것입니다. 아니면, 5분 또는 1시간 분량의 데이터 손실을 허용하기로 결정할 수도 있습니다.

  • 페일오버는 사용자에게 영향을 끼치지 않는 방식으로 작업을 백업 시스템으로 자동으로 넘기는 재해 복구 프로세스입니다. 이중화된 시스템이 즉시 운영을 맡을 준비가 된 상태에서 기본 데이터 센터에서 보조 사이트로 페일오버할 수 있습니다.

  • 페일백은 원래 시스템으로 돌아가는 재해 복구 프로세스입니다. 재해가 지나가고 기본 데이터 센터가 다시 작동되면 원활하게 페일백할 수 있을 것입니다.

  • 복원은 백업 데이터를 기본 시스템 또는 데이터 센터로 이전하는 프로세스입니다. 복원 프로세스는 일반적으로 재해 복구가 아니라 백업의 일부로 간주됩니다.

재해 복구 프로세스와 재해 복구 환경을 관리하기 위한 대안을 고려 중이라면 이 마지막 용어 하나가 유용할 것입니다.

  • DRaaS(Disaster Recovery as a Service)는 관리형 재해 복구 접근법입니다. 이 경우 타사가 재해 복구에 사용되는 인프라를 호스팅하고 관리합니다. 일부 DRaaS 오퍼링은 재해 복구 프로세스를 관리하는 도구를 제공하거나 이러한 프로세스를 대신 관리해 줍니다.
워크로드 우선 순위 지정

주요 개념을 이해했으면, 이제 이 개념들을 워크로드에 적용해야 할 때입니다. 많은 조직은 각 워크로드가 비즈니스에 대해 가지는 중요성을 반영하여 여러 RTO 및 RPO를 설정합니다.

주요 은행의 경우, 온라인 뱅킹 시스템은 필수 워크로드일 수 있습니다. 따라서 은행은 시간 손실과 데이터 손실을 최소화해야 합니다. 하지만, 은행 직원의 시간 추적 애플리케이션은 덜 중요합니다. 재해 발생 시 은행에서는 애플리케이션이 몇 시간 또는 심지어 하루 동안 중단되어도 비즈니스에 중대한 부정적 영향을 끼치지 않을 수 있습니다. 워크로드를 티어 1, 티어 2, 티어 3으로 정의하면 재해 복구 계획을 위한 프레임워크를 제공할 수 있습니다.

배포 옵션 평가

재해 복구 계획 설계의 다음 단계는 배포 옵션을 평가하는 것입니다. 일부 재해 복구 기능 또는 백업 데이터를 온프레미스에 두어야 합니까? 퍼블릭 클라우드 또는 하이브리드 클라우드 접근법 중 어느 것이 유용할까요?

Cloud

클라우드 기반 백업 및 재해 복구 솔루션은 모든 규모의 조직들 사이에서 점점 인기가 높아지고 있습니다. 많은 클라우드 솔루션이 데이터 저장을 위한 인프라를 제공하며, 백업 및 재해 복구 프로세스를 관리하기 위한 도구를 제공하는 경우도 있습니다.

클라우드 기반 백업 또는 재해 복구 오퍼링을 선택하면 인프라에 대한 대규모 자본 투자와 환경 관리 비용을 방지할 수 있습니다. 또한, 신속한 확장성을 구현하고 지역적 재해 발생 시 데이터를 안전하게 보호하는 데 필요한 지리적 거리를 확보할 수 있습니다.

클라우드 기반 백업 및 재해 복구 솔루션은 온프레미스 환경과 클라우드 기반 프로덕션 환경을 모두 지원할 수 있습니다. 예를 들면, 프로덕션 환경을 자체 데이터 센터에 두고 백업된 또는 복제된 데이터만 클라우드에 저장할 수 있습니다. 이러한 하이브리드 접근법을 따라도 여전히 프로덕션 환경을 이동하지 않은 채 확장성과 지리적 거리라는 이점을 누릴 수 있습니다. 클라우드-클라우드 모델에서는 프로덕션 및 재해 복구 환경이 모두 클라우드에 위치합니다. 물론 충분히 물리적으로 분리되도록 다른 사이트에 배치됩니다.

온프레미스

특정 백업 또는 재해 복구 프로세스를 온프레미스에서 실행하는 것이 데이터를 가져오고 IT 서비스를 신속하게 복구하는 데 도움이 되는 경우가 있습니다. 또한, 엄격한 데이터 보호 또는 데이터 주권 규정을 준수해야 하는 경우 중요한 데이터를 온프레미스에 보관하는 것이 좋아 보일 수 있습니다.

재해 복구 관점에서는 완전히 온프레미스 환경에 의존하는 계획은 문제가 있을 것입니다. 자연 재해 또는 정전이 발생하면 기본 시스템과 보조 시스템이 모두 포함된 데이터 센터 전체가 영향을 받게 됩니다. 이러한 이유로 대부분의 재해 복구 전략은 기본 데이터 센터에서 어느 정도 떨어진 보조 사이트를 활용합니다. 성능, 규정 준수, 보조 사이트에 대한 물리적 접근성 등 여러 요인을 어떻게 균형 있게 고려하느냐에 따라 보조 사이트를 한 마을 건넌 위치, 한 국가를 건넌 위치, 또는 지구 반대편에 둘 수 있습니다.  

기술

선택된 배포 옵션에 따라 백업 및 재해 복구에 활용할 기술과 프로세스에 대한 여러 가지 대안이 있을 수 있습니다.

전통적인 테이프

전통적 마그네틱 테이프 스토리지는 수십 년 동안 존재했지만 여전히 백업 계획에서 일정 역할을 수행할 수 있습니다. 테이프 솔루션으로는 대량의 데이터를 안정적이고 비용 효율적인 방식으로 저장할 수 있습니다.

테이프는 백업에 효과적일 수 있지만 보통은 재해 복구에 활용되지 않습니다. 재해 복구는 디스크 기반 스토리지의 빠른 액세스 시간을 요구합니다. 또한, 오프사이트 볼트에서 테이프를 물리적으로 꺼내야 할 경우, 가용성을 몇 시간 또는 심지어 며칠 동안 잃을 수도 있습니다.

스냅샷 기반 복제

스냅샷 기반 백업은 애플리케이션 또는 디스크의 현재 상태를 특정 순간에 포착합니다. 마지막 스냅샷 생성 후 변경된 데이터만 쓰기 때문에 이 방법은 데이터를 보호하면서 저장 공간을 절약할 수 있습니다.

스냅샷 기반 복제는 백업 또는 재해 복구에 사용될 수 있습니다. 물론, 데이터의 상태는 가장 최근의 스냅샷에 따라 결정됩니다. 매 시간 스냅샷을 생성하는 경우, 한 시간에 해당되는 데이터는 잃을 각오를 해야 합니다.

연속 복제

백업뿐만 아니라 재해 복구를 위해 연속 복제로 이동하고 있는 조직이 많습니다. 이 방법은 디스크 또는 애플리케이션의 최신 복제본이 계속적으로 다른 위치 또는 클라우드로 복제되어 다운타임이 최소화되고 복제 시점이 더 촘촘해집니다.

관련 솔루션
클라우드 재해 복구 솔루션

클라우드 재해 복구 계획으로 데이터를 보호합니다.

클라우드 재해 복구 솔루션 살펴보기
IBM Cloud® Object Storage - Backup and Recovery

IBM Cloud Object Storage가 데이터 백업을 위한 내구성과 확장성 그리고 보안이 뛰어난 대상을 제공하는 방법을 알아봅니다.

Cloud Object Storage 살펴보기
리소스 IBM Cloud Professional Site Reliability Engineer(SRE) 교육 및 인증

IBM이 제공하는 전문 교육 및 인증을 통해 SRE로 일하는 데 필요한 스킬을 향상하세요. IBM Cloud 환경 및 도구로 지식을 얻고 가상 랩에서 실습해 보세요.

데이터 센터란?

엔터프라이즈 및 클라우드 컴퓨팅을 가능하게 하는 물리적 시설인 데이터 센터에 대해 알아봅니다.

다음 단계

비즈니스 건전성 유지를 위해 백업 및 재해 복구 전략은 대부분의 조직에게 절대적으로 중요합니다.IBM Cloud 재해 복구 솔루션은 복잡성과 비용을 관리할 수 있도록 전략을 평가하고 업데이트하는 데 도움을 줄 수 있습니다.

IBM Cloud 재해 복구 솔루션 자세히 보기