데이터 라이프사이클 관리란?
도시 원형 교차로를 내려다본 모습
데이터 라이프사이클 관리란?

데이터 라이프사이클 관리(DLM)는 데이터를 입력할 때부터 삭제할 때까지 라이프사이클의 전 범위에서 데이터를 관리하는 접근 방식입니다. 다양한 기준에 따라 데이터를 여러 단계로 구분하고, 각기 다른 작업을 완료하거나 특정 요건을 충족하면 차례로 다음 단계로 진행합니다. 우수한 DLM 프로세스라면 기업의 데이터에 구조와 체계를 부여해야 합니다. 그러면 해당 프로세스에서 데이터 보안, 데이터 가용성 등과 같은 핵심 목표를 달성할 수 있습니다.  

이러한 목표는 비즈니스 성공에 필수적이며, 점차 더욱 중요해지고 있습니다. DLM 정책 및 프로세스는 기업이 데이터 침해, 데이터 유출, 시스템 장애 및 그에 따른 중대한 상황에 대비하는 데 큰 역할을 합니다. 빠르게 증가하는 데이터를 노리면서 시장을 공략하는 악의적 의도를 가진 이들이 늘고 있는 만큼 우수한 DLM 전략이라면 데이터 보호 및 재해 복구에 우선순위를 두어야 합니다. 그러면 재해가 발생하더라도 효과적인 데이터 복구 계획이 마련되어 있으므로, 브랜드의 수익성 및 전반적인 평판에 미칠 타격을 완화할 수 있습니다.

데이터 라이프사이클 관리 vs. 정보 라이프사이클 관리

정보 라이프사이클 관리(ILM)가 데이터 라이프사이클 관리와 같은 의미로 사용되곤 합니다. ILM은 데이터 관리 프랙티스에 포함되나 DLM과는 다릅니다.  

데이터 라이프사이클 관리는 파일 단계의 데이터를 다룹니다. 즉, 유형, 크기, 연령을 기준으로 파일을 관리합니다. 이와 달리 ILM은 파일에 수록된 개별 데이터를 관리하면서 데이터의 정확성을 보장하고 적시에 업데이트합니다. 여기에는 이메일 주소, 계좌 잔액 등과 같은 사용자 정보가 포함됩니다.  

데이터 라이프사이클 관리의 단계

데이터 라이프사이클은 데이터의 가용 수명에 걸친 일련의 단계로 구성됩니다. 각 단계는 정책 모음이 적용됩니다. 이 정책은 라이프사이클의 단계별로 데이터의 가치를 극대화합니다. 비즈니스 워크스트림에 포함되는 데이터의 양이 늘어남에 따라 DLM이 더욱 중요해졌습니다. 

1단계: 데이터 생성

새로운 데이터 라이프사이클은 데이터 수집에서 시작합니다. 그러나 데이터 소스는 무궁무진합니다. 웹 및 모바일 애플리케이션, IoT(internet of things) 디바이스, 각종 양식, 설문 등 매우 다양해질 수 있습니다. 데이터는 다양한 방식으로 생성될 수 있으나, 비즈니스 성공을 위해 모든 가용 데이터를 수집해야 하는 것은 아닙니다. 새로운 데이터를 통합할 때는 반드시 그 품질 및 비즈니스와의 연관성을 기준으로 평가를 거쳐야 합니다. 

2단계: 데이터 저장

데이터는 그 구조에 따라서도 달라질 수 있습니다. 이는 기업에서 사용하는 데이터 스토리지의 유형에 영향을 미칩니다. 정형화된 데이터는 관계형 데이터베이스를 활용하는 편입니다. 이와 달리 비정형 데이터는 NoSQL 데이터베이스나 비 관계형 데이터베이스를 활용합니다. 해당 데이터 세트를 위한 스토리지 유형을 결정했다면, 인프라에 보안 취약점이 있는지 평가할 수 있습니다. 그리고 데이터는 보안 공격으로부터 비즈니스를 보호하기 위해 다양한 유형의 데이터 처리(예: 데이터 암호화, 데이터 변환)를 거칠 수 있습니다. 이러한 유형의 데이터 멍잉(data munging)을 통해 중요 데이터는 개인정보 보호 및 정부 정책상의 요건(예: GDPR)을 충족하게 됩니다. 그러면 해당 기업은 관련 규정 불이행으로 인해 막대한 과징금이 부과되는 상황을 방지할 수 있습니다. 

데이터 보호의 또 다른 영역에서는 데이터 이중화에 초점을 맞춥니다. 저장된 데이터의 복사본이 데이터가 삭제되거나 손상되는 등의 상황에서 백업의 역할을 할 수도 있습니다. 즉, 실수로, 또는 악성 코드 공격과 같이 의도적으로 데이터가 변경되는 것을 방지합니다.  

3단계: 데이터 공유 및 사용

이 단계에서는 비즈니스 사용자가 데이터를 사용할 수 있게 됩니다. DLM을 통해 기업에서 누가 어떤 목적으로 데이터를 사용할 수 있는지를 정의하는 것이 가능합니다. 데이터가 사용 가능해지면 다양한 분석, 즉 기본적인 탐색 차원의 데이터 분석 및 데이터 시각화는 물론 더 정교한 데이터 마이닝 및 머신 러닝 기법 등에도 활용할 수 있습니다. 이 모든 방식이 비즈니스 의사결정 및 여러 이해 관계자와의 소통에 저마다의 역할을 합니다. 

또한, 이 데이터가 내부에서만 쓰이는 것은 아닙니다. 이를테면 외부 서비스 제공자가 마케팅 분석, 광고 등의 목적으로 데이터를 활용할 수 있습니다. 내부적으로 사용하는 경우에는 일상적인 비즈니스 프로세스 및 워크플로(예: 대시보드, 프레젠테이션)가 포함됩니다.

4단계: 데이터 보관

어느 정도 시간이 지나면, 데이터가 모든 업무에 필요하지는 않은 상황이 됩니다. 그러나 만일의 소송 및 조사에 필요할 수 있으므로, 자주 액세스하지 않는 데이터도 복사본을 보관하는 것이 중요합니다. 이렇게 보관된 데이터는 필요할 때 활성 프로덕션 환경으로 복원할 수 있습니다. 

기업의 DLM 전략에서는 언제 어디서 얼마 동안 데이터를 보관해야 하는지를 명확히 규정해야 합니다. 이 단계에서 데이터는 이중화를 보장하는 아카이브 프로세스를 거칩니다.

5단계: 데이터 삭제 

라이프사이클의 마지막 단계입니다. 데이터를 기록에서 지우고 안전한 방식으로 폐기합니다. 기업에서 이제는 필요하지 않은 데이터를 삭제하여 활성 데이터를 위한 스토리지 공간을 더 많이 확보합니다. 이 단계에서는 필수 보존 기간이 지난 데이터, 또는 해당 조직에서 더는 유의미한 목적으로 쓰이지 않는 데이터를 아카이브에서 삭제합니다.

데이터 라이프사이클 관리로 누릴 수 있는 이점

데이터 라이프사이클 관리는 다음과 같이 여러 중요한 이점을 제공합니다. 

• 프로세스 개선: 데이터는 조직의 전략적 이니셔티브를 추진하는 데 중요한 역할을 합니다. DLM을 통해 라이프사이클의 전 범위에서 데이터 품질을 유지합니다. 그러면 프로세스를 개선하고 효율성을 높일 수 있게 됩니다. 올바른 DLM 전략이 있으면, 정확하고 신뢰할 수 있는 데이터가 사용자에게 제공됩니다. 해당 기업은 데이터의 가치를 극대화할 수 있습니다.

• 비용 절감: DLM 프로세스는 라이프사이클의 각 단계에서 데이터의 가치를 더해줍니다. 데이터가 프로덕션 환경에서 더는 유용하게 쓰이지 않는다면, 다양한 솔루션, 즉 데이터 백업, 복제, 아카이빙 등을 통해 비용을 줄일 수 있습니다. 이를테면 온프레미스, 클라우드, 또는 NAS(network attached storage)에 있는 저렴한 스토리지로 이동합니다.

• 데이터 사용 편이성: IT 팀은 DLM 전략을 통해 모든 메타데이터 태그를 일관성 있게 적용하는 정책과 절차를 개발할 수 있습니다. 그러면 필요할 때 더 용이한 접근이 가능합니다. 시행 가능한 거버넌스 정책을 수립함으로써 데이터를 보존하는 내내 그 가치를 보장할 수 있습니다. 안전하고 유용한 데이터를 확보한 기업은 더 민첩하고 효율적인 프로세스를 수행할 수 있게 됩니다.

• 컴플라이언스 및 거버넌스: 업종별로 데이터 보존에 관한 규칙과 규정이 있기 마련입니다. 우수한 DLM 전략을 통해 그러한 규칙과 규정을 상시 이행할 수 있습니다. DLM은 기업의 데이터를 더 효율적으로 안전하게 다룰 뿐만 아니라 개인의 데이터 및 기업의 기록에 관한 데이터 프라이버시 법을 준수하도록 지원합니다.

리소스 IBM Security Framing & Discovery 워크숍

가상 또는 대면 형식으로 3시간 동안 진행되는 이 무료 디자인 씽킹 세션에서는 IBM 보안 아키텍트 및 컨설턴트와 함께 귀사의 사이버 보안 환경을 진단하고 여러 이니셔티브의 우선순위를 결정할 수 있습니다.

하이브리드 환경을 위한 데이터 통합 및 라이프사이클 관리 전략 개발

이 eBook에서는 하이브리드 환경을 위해 데이터 통합 및 라이프사이클 관리 전략을 수립하고 이행하는 방법을 알아봅니다. (1.4MB)

정보 라이프사이클 거버넌스 솔루션

다양한 정보 라이프사이클 거버넌스 솔루션에 관해 이 eBook에서 자세히 알아보세요. (446KB)

SBI(State Bank of India)

State Bank of India가 IBM Garage™ 방법론과 함께 여러 IBM 솔루션을 사용하여 포괄적인 온라인 뱅킹 플랫폼을 개발한 방법을 알아보세요.

데이터를 통한 차별화: 리더를 위한 가이드

기업의 우위를 강화하는 데이터 전략을 설계하고 이행하기 위한 전략 단계를 심층 탐구합니다.

IBM Research 간행물 읽기

IBM Research의 지식이 정기적으로 IBM Cloud Pak for Data의 새로운 기능으로 구현됩니다.

데이터 라이프사이클 관리와 IBM

IBM이 제공하는 비즈니스 솔루션은 요구 사항 단계부터 폐기 단계까지 전 과정에서 데이터를 효과적으로 관리하면서 비즈니스 민첩성을 강화하고 비용을 절약하도록 지원합니다. IBM Cloud Pak for Data는 마이크로서비스와 주요 데이터 및 AI 기능을 활용하여 분산 시스템에서 데이터를 지능적으로 통합하여 기업에 비즈니스 성과에 대한 전체적인 시각을 제공합니다. 이를 바탕으로 엔터프라이즈 데이터를 더 빠르게 수집하고 체계화하여 인사이트를 발굴할 수 있습니다. 그리고 어떤 규모에서도 현명한 의사결정이 가능해집니다. 또한 데이터 관리 팀은 IBM의 경쟁력 있는 보안 프레임워크 덕분에 데이터의 안전성을 신뢰할 수 있습니다. 그에 따라 규제 정책을 충실히 이행하면서 컴플라이언스 관련 위험을 줄일 수 있습니다.

IBM Cloud Pak for Data