데이터 마이그레이션은 한 스토리지 시스템이나 컴퓨팅 환경에서 다른 스토리지 시스템이나 컴퓨팅 환경으로 데이터를 전송하는 프로세스입니다. 데이터 마이그레이션은 온프레미스 IT 인프라를 클라우드 컴퓨팅 환경으로 마이그레이션하는 전체 프로세스에서 필수적인 단계입니다.
기업에서 데이터 마이그레이션 프로젝트를 수행해야 하는 데에는 여러 가지 이유가 있습니다. 예를 들어 서버 또는 스토리지를 교체하거나 데이터 센터를 통합 또는 폐기할 수 있습니다.
퍼블릭 클라우드, 프라이빗 클라우드, 하이브리드 클라우드 또는 멀티 클라우드 환경 중 어떤 환경으로 이동하든 데이터를 새로운 스토리지 위치로 마이그레이션하는 안전하고 비용 효율적이며 효과적인 방법을 찾아야 합니다.
오늘날 기업은 점점 더 많은 양의 데이터를 생성하고 데이터에서 추출한 가치를 극대화해야 하는 점점 더 커져가는 압박에 직면해 있습니다. 이러한 환경에서는 워크로드에 최적화된 환경을 선택하고 데이터를 효율적이고 접근하기 쉽게 저장하는 것이 성공의 관건입니다.
많은 기업이 가장 비용 효율적이고 성능이 우수한 IT 환경에서 애플리케이션을 호스팅하기 위해 워크로드를 클라우드로 이전하는 방법을 선택하고 있습니다. 올바른 데이터 마이그레이션 솔루션을 선택하는 것은 클라우드 마이그레이션 계획 프로세스의 핵심 구성 요소이며 초기 단계부터 고려해야 합니다.
로컬 데이터 센터에서 클라우드로 데이터를 전송하기 위한 여러 옵션 중에서 선택할 수 있지만, 이는 크게 두 가지 범주로 나뉩니다.
특정 데이터 마이그레이션 프로젝트에 가장 적합한 옵션은 이동해야 하는 데이터의 양, 마이그레이션을 완료해야 하는 속도, 관련된 워크로드 유형 및 보안 요구 사항에 따라 달라집니다.
데이터베이스 마이그레이션은 특수 워크로드 마이그레이션의 한 예입니다. 많은 퍼블릭 및 프라이빗 클라우드 제공업체는 데이터베이스 마이그레이션 프로세스의 일부를 용이하게 하거나 자동화할 수 있는 도구를 제공하여 전송 내내 데이터베이스가 안전하게 유지되고 데이터 손실이나 손상이 발생하지 않도록 합니다. 또한 대부분의 클라우드 제공업체는 전송 후 데이터의 무결성을 확인할 수 있는 마이그레이션 서비스를 제공합니다.
일반적으로 데이터베이스 마이그레이션 프로세스의 첫 번째 단계에는 원본 데이터베이스의 스키마(필요한 경우)를 대상 데이터베이스와 호환되도록 변환하는 작업이 포함됩니다. 데이터베이스의 스키마는 데이터베이스가 어떻게 구성되는지에 대한 청사진과 같으며, 논리적 아키텍처와 구조를 제어합니다. 대상 데이터베이스 관리 시스템이 소스 데이터베이스와 호환되지 않는 데이터 정의 언어(DDL)를 사용하는 경우 스키마를 변환해야 합니다.
다음 단계는 데이터를 마이그레이션하고 지속적인 증분 데이터 웨어하우스 업데이트를 설정하는 것입니다. 필요한 경우 이 프로세스 중에 여러 데이터베이스를 하나로 통합할 수도 있습니다. 클라우드에 저장될 때 데이터가 어떻게 구성되는지 자세히 알아보려면 “클라우드 데이터베이스 설명”을 참조하세요.
전체 데이터 센터 환경을 클라우드나 다른 위치로 마이그레이션하는 것은 대규모의 포괄적인 프로세스입니다. 다운타임이나 운영 중단을 최소화하면서 이러한 마이그레이션 프로젝트를 성공적으로 완료하려면 신중한 계획과 조정이 필요합니다.
데이터 센터 마이그레이션이나 기타 대규모 데이터 마이그레이션 프로젝트를 고려할 때는 계획 단계 초기에 일정을 고려하는 것이 중요합니다. 페타바이트 규모의 전송은 비교적 빠른 네트워크 연결에서도 완료하는 데 몇 주가 걸릴 수 있기 때문입니다.
기업이 데이터 마이그레이션을 더 신중하게 계획할수록 예상치 못한 비용이나 계획되지 않은 다운타임이 발생할 가능성이 줄어들고 마이그레이션 중 및 마이그레이션 후에 최종 사용자가 좌절하거나 불편을 겪을 가능성도 줄어듭니다. 목표를 설정하고 타임라인을 설정하여 직면할 수 있는 문제를 예상해야 합니다.
프로젝트 접근 방식을 결정할 때 고려해야 할 세 가지 주요 요소가 있습니다.
워크로드 유형. 가상 머신(VM), 백업 또는 데이터베이스와 같은 특수 워크로드는 일반적으로 마이그레이션할 데이터 유형에 맞는 소프트웨어 공급업체 제공 툴을 사용하여 이동할 수 있습니다. 이러한 툴에 액세스할 수 없는 경우 잠재적인 다운타임에 대비하여 신중하게 계획을 세워야 합니다. 미션 크리티컬 워크로드에 대한 데이터를 단계적으로 전송하고, 프로세스 전반에 걸쳐 간격을 두고 테스트하고, 소스 및 대상 시스템을 병렬로 실행할 수 있습니다. 또는 생산 시간 외에 대규모 전송을 계획할 수도 있습니다(가능한 기간 내에 완료할 수 있는 경우).
데이터의 양. 10테라바이트(TB) 미만의 데이터를 마이그레이션하는 경우 클라이언트가 제공한 스토리지 디바이스의 새로운 스토리지 위치로 데이터를 전송하는 것이 가장 간단하고 비용 효율적인 방법인 경우가 많습니다. 최대 수 페타바이트(PB)에 달하는 대용량 데이터를 전송하는 경우에는 클라우드 제공업체에서 제공하는 전문 데이터 마이그레이션 장치를 사용하는 것이 가장 편리하고 경제적인 옵션이 될 수 있습니다. 이론적으로는 모든 양의 데이터에 대해 온라인 마이그레이션을 사용할 수 있지만, 시간 제약으로 인해 대량의 데이터인 경우 그 실현 가능성이 제한됩니다.
완료 속도. 온라인 마이그레이션의 경우 전송되는 데이터의 양과 네트워크 연결 속도에 따라 데이터 마이그레이션에 걸리는 시간이 결정됩니다. 오프라인 마이그레이션의 경우 전송 시간을 고려해야 합니다. 처음부터 끝까지 마이그레이션 속도가 가장 중요하고 마이그레이션에 사용할 수 있는 대역폭이 충분하다면 온라인 전송이 최선의 선택일 수 있습니다. 그러나 마이그레이션 기한이 유동적이거나 대역폭 또는 기타 네트워킹 제약 조건이 있는 경우 오프라인 마이그레이션이 적합한 선택일 수 있습니다.
프로젝트를 원활하게 진행하려면 다음 모범 사례를 준수하세요.
데이터와 데이터의 용도를 이해하세요. 현재 데이터를 사용하는 사람은 누구이며, 앞으로는 누가 사용할 것이며, 어떻게 사용될 것인가? 예를 들어 분석에 활용되는 데이터는 규정 준수를 위해 보관하는 데이터와 스토리지 및 형식 지정 요구 사항이 매우 다를 수 있습니다. 마이그레이션 프로세스 전반에 걸쳐 모든 관련 이해관계자 및 사업부로부터 정보를 수집하세요.
소스 환경과 대상 환경을 신중하게 평가하세요. 두 환경 모두에서 동일한 운영 체제가 실행되나요? 데이터베이스 스키마 또는 기타 형식을 변경해야 하나요? 마이그레이션 전에 해결해야 할 문제(예: 중복성 문제 또는 과도한 '더티' 데이터)가 있나요?
프로세스 초기에 비즈니스 요구 사항과 잠재적 영향을 파악하세요. 어떤 종류의 마이그레이션 타임라인이 필요한가요? 데이터 센터를 폐기하는 경우 임대 계약은 언제 만료되나요? 마이그레이션 프로세스 전반에 걸쳐 어떤 유형의 데이터 보안을 유지해야 하나요? 데이터 손실이나 손상이 허용 가능한 수준인지, 허용된다면 그 정도는 어느 정도인가요? 지연이나 예상치 못한 장애물이 비즈니스에 어떤 영향을 미칠까요?
IT 시스템 현대화의 이점은 특히 장기적으로 볼 때 데이터 마이그레이션과 관련된 위험보다 크지만, 데이터 마이그레이션은 스트레스와 위험을 수반할 수 있습니다. 다음은 고려해야 할 몇 가지 위험 요소입니다.
오늘날에는 엔터프라이즈 데이터 마이그레이션을 용이하게 하는 다양한 툴이 있습니다. 여기에는 클라우드 제공업체가 고객의 퍼블릭 또는 프라이빗 클라우드 환경으로의 이전을 지원하기 위해 제공하는 공급업체별 솔루션과 라이선스 및 오픈 소스 툴이 포함됩니다. 데이터 마이그레이션 전략에 따라 프로젝트에 가장 적합한 툴을 결정합니다.
몇 가지 인기 있는 옵션은 다음과 같습니다.
데이터 마이그레이션 서비스는 사내 기능을 보완하거나 전략에서 완료, 테스트 및 문서화에 이르기까지 전체 마이그레이션 프로세스를 관리할 수 있습니다. 흔히 '화이트 글러브 데이터 마이그레이션 서비스'라고 불리는 후자의 서비스는 예상대로 비용이 더 많이 들지만, 사내 데이터 마이그레이션 전문 지식이 제한적이고 마이그레이션하는 애플리케이션이 비즈니스에 중요한 경우 가치가 있을 수 있습니다. 데이터베이스 마이그레이션 컨설턴트는 다운타임을 최소화하거나 제거하는 비용 효율적인 마이그레이션 프로세스를 계획하는 데 도움을 줄 수 있습니다.
오픈 데이터 레이크하우스 접근 방식을 통해 신뢰할 수 있는 데이터를 제공하고 분석 및 AI 프로젝트를 더 빠르게 실행하는 방법을 알아보세요.
IBM, 2024년 Gartner Magic Quadrant 데이터 통합 툴 부문에서 19년 연속 리더 기업으로 선정
데이터 리더가 데이터 기반 조직을 구축하고 비즈니스 우위를 확보하는 방법을 살펴보세요.
정형 및 비정형 데이터 준비를 촉진하고 AI 성과를 가속화하는 데 AI 기반 데이터 인텔리전스 및 데이터 통합이 중요한 이유를 알아보세요.
데이터 접근을 간소화하고 데이터 거버넌스를 자동화하세요. 어디서나 모든 데이터를 사용하여 워크로드 비용 최적화, AI 및 분석 확장을 포함하여 데이터 레이크하우스 전략을 데이터 아키텍처에 통합하는 방법을 알아보세요.
IBM Research가 IBM Cloud Pak for Data의 새로운 기능에 정기적으로 통합되는 방식을 살펴보세요.
진화하는 ABI 솔루션 환경에 대한 고유한 인사이트를 제공하고 데이터 및 분석 리더를 위한 주요 결과, 가정 및 권장 사항을 강조합니다.
탁월한 고객 및 직원 경험을 제공하기 위해 데이터 사일로를 제거하고, 복잡성을 줄이며, 데이터 품질을 개선해 주는 데이터 전략을 구축하세요.
watsonx.data를 사용하면 오픈, 하이브리드 및 관리형 데이터 저장소를 통해 데이터의 위치와 관계없이 모든 데이터로 분석과 AI를 확장할 수 있습니다.
IBM Consulting을 통해 엔터프라이즈 데이터의 가치를 실현하여 비즈니스 이점을 제공하는 인사이트 중심의 조직을 구축하세요.