게시일: 2024년 3월 21일
기고자: Phill Powell, Ian Smalley
여기서 이 애매모호한 용어들에 대해 잠깐이지만 정확하게 알아보도록 하겠습니다. 초보자의 입장에서 보면, 두 용어는 서로 같은 의미로 사용되는 경우가 많아 혼동을 일으킬 수 있습니다.
“하이퍼스케일러”는 하이퍼스케일 데이터 센터의 별칭으로 자주 사용됩니다. 그러나 “하이퍼스케일러”는 이미 다른 의미가 정해진 용어로서, AWS 같은 클라우드 서비스 공급업체(cloud service provider, CSP)와 하이퍼스케일 데이터 센터 서비스를 제공하는 기타 회사를 지칭하는 말로 자주 사용됩니다.
이 말과 동일한 용어가 데이터 센터의 유형, 그리고 전문 분야가 하이퍼스케일 컴퓨팅이면서 하이퍼스케일 데이터 센터를 제공하는 기업, 이 두 가지를 모두 지칭할 때 사용되기도 하므로 혼동을 일으킬 가능성이 있습니다(예: “이 하이퍼스케일러는 해당 하이퍼스케일러를 창설했습니다.”). 따라서 이 페이지에서는 하이퍼스케일 데이터 센터에 대해 설명하고 클라우드 서비스 공급업체(CSP)를 각각 고유한 용어로 지칭하겠습니다. 보다 포괄적인 용어인 “하이퍼스케일러”는 언급하지 않겠습니다.
데이터 센터(규모에 관계없음)의 기원을 거슬러 올라가면 가상화(virtualization)라는 중요한 개념이 있습니다. 가상화란 단일 컴퓨터의 하드웨어 구성 요소를 여러 가상 머신(VM)으로 분할할 수 있도록 소프트웨어로 컴퓨터 하드웨어 위에 추상화 계층을 생성하는 작업입니다. 각 VM은 자체 OS를 실행하며, OS가 실제로 기본 컴퓨터 하드웨어의 일부에서만 실행되더라도 독립된 컴퓨터처럼 작동합니다. 이러한 과정에 따라 가상화를 통해 클라우드 컴퓨팅이 이루어지는 것입니다.
하이퍼스케일 데이터 센터는 그 규모만으로도 기존 데이터 센터와 큰 차이를 보입니다. 하이퍼스케일 데이터 센터를 세우려면 최소 5,000대의 서버와 수 마일에 달하는 연결 장비 등 관련 장비를 모두 보관할 수 있을 정도로 큰 물리적 공간이 필요합니다. 이에 따라 하이퍼스케일 데이터 센터가 수백만 평방피트 규모의 공간을 쉽게 아우를 수도 있습니다.
이중화는 하이퍼스케일 데이터 센터의 또 다른 중요 요소로, 쉽게 말해서 장비가 고장났거나 전원이 끊겼을 경우 자동으로 작동할 수 있는 백업 수단 및/또는 장치를 제공하는 작업입니다. 하이퍼스케일 데이터 센터에서는 이러한 시스템이 24시간 내내 직접적인 감찰 없이 백그라운드에서 자동으로 실행되는 경우가 많기 때문에 이중화가 특히 중요합니다.
하이퍼스케일 데이터 센터를 운영하려는 조직은 최선의 조치를 정할 때 수많은 결정을 내려야 합니다. 가장 먼저 떠오르는 의문은 아마 “건물을 지어야 할까, 아니면 빌려야 할까?”일 것입니다. 적당한 규모로 데이터 센터를 짓는다고 해도 일정 정도의 투자는 반드시 따라옵니다. 하이퍼스케일 데이터 센터를 건설하려면 재정을 훨씬 더 큰 규모로 쏟아부어야 합니다.
많은 기업이 또 하나의 방법, 즉 코로케이션 데이터 센터를 택하고 있습니다. 코로케이션 데이터 센터란 소유주가 설비와 서버 공간을 다른 사업체에 임대해 주는 데이터 센터를 말합니다. 이 방법은 실행하는 즉시 그 장점을 보여줍니다. 하드웨어 설치에 필요한 공간을 빌릴 때 필요한 투자의 액수는 적어도 대금을 선지급한다는 점에서 장비를 보관할 건물 전체를 짓는 것보다는 훨씬 적습니다.
이 두 가지 기본 옵션을 비교해 보면 각각의 장단점이 뚜렷합니다. 하이퍼스케일 데이터 센터를 짓는 일은 대개 경비가 많이 들고 상당한 노동력을 요하지만, 조정 가능한 모든 요소를 적절히 최적화함으로써 해당 기업에 맞게 건축된 하이퍼스케일 시설이 탄생하기도 합니다.
반면에 코로케이션 데이터 센터 용도로 공간을 임대할 때는 기동력에 필요한 옵션이 더 많이 늘어나고, 훨씬 적은 비용만 투자하면 됩니다. 다만 코로케이션 데이터 센터가 해당 고객의 이상적인 사양에 맞게 설계되었을 가능성은 아주 낮아질 겁니다.
프라이빗 클라우드 기반 시스템에 맞는 비싼 스토리지 장비를 추가로 구매할 필요 없이, 사업을 계속 진행할수록 끊임없이 확장할 수 있는 다른 옵션을 물색 중인 조직들도 있습니다. 이들 기업 중 상당수에게 가장 적절한 방법은 민간 소유의 시스템에서 마이그레이션해서 Microsoft 365 또는 Google Suite와 같은 서비스형 소프트웨어(Software-as-a-Service, SaaS) 앱을 비롯한 퍼블릭 클라우드 환경으로 운영을 이전하는 것입니다.
이외의 방법으로 모듈형 데이터 센터, 즉 데이터 센터로 사용하도록 설계된 조립식 시설도 있습니다. 모듈형 데이터 센터는 조립식일 뿐만 아니라 필수 냉각 장비가 미리 배관되고 장착되어 있습니다. 모듈형 데이터 센터는 대규모 투자를 하기 전에 제한된 방식으로 데이터 센터 기능을 실험해 보려는 조직, 그리고 안정적인 데이터 센터 솔루션을 신속하게 이행해야 하는 기업에 가장 적합합니다.
데이터 센터는 1940년대부터 사용되어 왔습니다. 당시에는 거대한 컴퓨터 한 대만이 사무실 공간 전체를 가득 채우고 있었습니다. 오랜 세월에 걸쳐 컴퓨터의 크기 대비 효율이 높아지면서 컴퓨터가 차지하는 온프레미스 물리 공간도 발전했습니다. 이후 1990년대가 되자, 마이크로컴퓨터가 사상 최초로 급증하면서 IT 운영에 필요한 컴퓨터 크기가 급격히 줄어들었습니다. 얼마 지나지 않아 “서버실”의 명칭이 “데이터 센터”로 바뀌게 되었죠.
주요 발전 과정을 살펴봤을 때, 최초의 하이퍼스케일 데이터 센터는 2006년 Google이 미국 오리건주 더 댈러스(The Dalles, 포틀랜드 인근)에 설립한 곳으로 알려져 있습니다. 이 하이퍼스케일 시설은 현재 130만 평방피트 규모의 공간을 점유하고 있으며 근무 중인 데이터 센터 운영직 직원이 약 200명에 달합니다. “현재”라는 표현을 사용한 이유는 Google이 최근 미화 6억 달러를 들여 이 “에너지 캠퍼스(energy campus)”에 29만 평방피트 면적의 다섯 번째 건물을 추가하는 확장 계획을 추진 중이기 때문입니다. Google은 이 기술에 대해 지속적으로 투자하는 한편, 미국의 14개 데이터 센터 시설 외에도 유럽, 아시아, 칠레에서도 각각 6개, 3개, 1개의 데이터 센터를 운영하고 있습니다.
현재 시점에서 세계 최대의 하이퍼스케일 시설(ibm.com 외부 링크)은 중국 내몽골 지역에 있습니다. 이곳이 바로 China Telecom이 운영하는 약 1,070만 평방피트 규모의 하이퍼스케일 데이터 센터입니다. 다시 말해서, 이 최대 데이터 센터의 규모는 미국 정식 축구 경기장 165개를 가로 너비 11개, 세로 길이 15개인 공간으로 전부 합친 것과 같습니다. 당연하게도 이 거대한 하이퍼스케일 데이터 센터(건설 비용: 미화 30억 달러)는 직무에 필요한 모든 설비를 갖추고 있으며, 하이퍼스케일 데이터 센터 운영직 근무자를 위한 기숙사 시설도 제공합니다.
주요 하이퍼스케일 기업들의 순위를 매기면 문제가 생길 수 있습니다. 우선 비교적 쉽게 해결할 수 있는 문제가 바로 어떤 기준을 활용할지 정하는 것입니다. 이론상으로는 소유하거나 건설한 하이퍼스케일 데이터 센터의 수를 기준으로 삼아도 되지만, 이것은 기업의 클라우드 서비스 제공 능력을 아주 정확하게 판단할 수 있는 방법은 아닙니다. 수많은 기업(애플 포함)이 사용 중인 데이터 센터 중 일부를 다른 서비스 제공업체로부터 임대하고 있기 때문입니다.
따라서 비교 가능한 방법은 시장 점유율 하나뿐입니다. 이 수치는 어떤 하이퍼스케일 기업이 시장을 실제로 주도하고 있는지를 최종적으로 보여주는 최고의 지표입니다. 그럼에도 이 방법은 하이퍼스케일 컴퓨팅 시장이 고정 상태가 아니고 항상 유동적이라는 점에서 다소 불완전합니다.
그 대신, 상위권 기업들인 3대 하이퍼스케일 공급업체가 현재 이 시장의 최대 부분을 굳건하게 점유하고 있음을 시사하는 동향 증거가 다음과 같이 충분히 있습니다.
AWS는 현재 하이퍼스케일 클라우드 서비스 분야의 최대 공급업체입니다. AWS의 시장 점유율(ibm.com 외부 링크)은 약 32%로 가장 우세합니다. AWS는 클라우드 리전 32곳 및 가용 영역 102곳으로 운영되는데, 이들의 총 면적은 3,350만 평방피트입니다. AWS는 자동화, 데이터베이스 관리, 데이터 분석 전문 기업으로 유명합니다.
Microsoft의 인기 하이퍼스케일 플랫폼인 Azure는 현재 하이퍼스케일 시장의 약 23%(ibm.com 외부 링크)를 차지하고 있습니다. Azure는 가용 영역 120곳을 통해 클라우드 리전 62곳에서 운영되고 있습니다. 당연한 말이지만, Microsoft Azure는 Microsoft의 기업급 데이터 센터용 소프트웨어와 함께 사용할 때 특히 잘 작동합니다.
본래 데이터 처리 분야의 전문가로 가장 유명한 Google Cloud는 하이퍼스케일 시장의 약 10%(ibm.com 외부 링크)를 점유하고 있으며, 가용 영역 118곳을 통해 클라우드 리전 39곳에서 운영됩니다. GCP는 데이터 처리뿐만 아니라 인공 지능(AI) 및 고급 분석 분야에서도 우수한 역량을 발휘하며 기업들을 유치하고 있습니다.
이외에도 수많은 공급업체가 동일한 시장에서 2위권 시장 점유율을 차지한 상태로 운영되고 있습니다.
Alibaba Cloud: Alibaba는 AWS나 다른 상위권 공급업체만큼 규모가 크지는 않으나, 아시아-태평양 지역에서 탄탄한 하이퍼스케일 시장 점유율을 기록하고 있습니다. 이 회사의 주요 상품으로는 인프라 관련 제품과 AI 서비스가 있습니다.
Apple: Apple은 자체 클라우드 서비스에 하이브리드 모델을 적용하고 있습니다. Apple은 미국, 유럽, 중국에 8개 데이터 센터를 보유하고 있으며 향후 데이터 센터를 몇 군데 더 건설할 계획입니다. 또한 Apple은 AWS, GCP 등 공급업체의 클라우드 컴퓨팅 서비스를 제공하기 위한 다년간의 대여 계약을 체결한 상태입니다.
IBM Cloud: 오랜 세월 동안 기술 확장의 대명사로 자리매김한 IBM Cloud는 기업급 데이터 센터와 협업하고 다양한 관련 분야의 서비스를 제공해 온 경험이 풍부합니다. 최근에는 AI와의 협업에 앞장서면서 사업에 대한 시야를 새롭게 넓혀 가고 있습니다.
Meta Platforms: 인기 온라인 플랫폼인 Facebook과 Instagram의 모기업인 Meta Platforms는 전 세계 21개의 하이퍼스케일 데이터 센터를 운영하고 있습니다. 이 데이터 센터들의 총 면적은 5,000만 평방피트가 넘습니다.
Oracle Cloud Infrastructure(OCI): OCI는 AWS를 대체할 만한 저가형 공급업체로 입지를 굳혔으며, 유사 서비스를 훨씬 저렴한 가격대로 제공합니다. OCI는 클라우드 네이티브 앱을 개발하고 작업에 필수적인 워크로드를 쉽게 마이그레이션할 수 있도록 지원하는 역량이 탁월합니다.
전력 사용량은 하이퍼스케일 데이터 센터와 관련하여 가장 시급한 문제입니다. 하이퍼스케일 데이터 센터 운영에 필요한 최고급 컴퓨팅 성능에는 엄청난 양의 전력이 소모됩니다. 암호화폐/비트코인 채굴이 대두되고 있는 것과 마찬가지로, 하이퍼스케일 데이터 센터는 상당히 최근에 개발된 기술이면서도 전력에 대한 수요가 전례 없이 높아, 생태계 관련 지속가능성 목표와 다소 상충됩니다. 그래도 이러한 문제를 경감하거나 완전히 종결시킬 방법을 찾고 있는 기업들도 있습니다.
지속적으로 운영되고 있는 수천 대의 컴퓨터 서버 외에도 염두에 둬야 할 요소는 전원/네트워킹 장비(예: 변압기, 라우터)의 전기 요건, 그리고 하드웨어의 열 과부하 발생을 방지할 매우 중요한 냉각 시스템입니다. 이 까다로운 상황을 억제하기 위한 대형 건물의 건설과 운영에 드는 비용은 말할 필요도 없고요.
그렇기 때문에 하이퍼스케일 데이터 센터를 효과적으로 운영하려면 에너지 효율이 매우 중요합니다. 한 서버가 최고 효율로 가동되지 않는다면 이 일을 무시해도 될 정도로 중요하지 않은 것으로 여겨도 됩니다. 그러나 하이퍼스케일 시설에 설비된 수천 대의 서버가 효율적으로 작동하지 않는다면, 이 일은 훨씬 더 심각하고 많은 경비를 초래할 문제로 간주될 것입니다.
하이퍼스케일 데이터 센터에 필요한 전력은 시설의 규모에 따라 메가와트 단위 또는 기가와트 단위에 달할 수 있습니다. 하이퍼스케일 데이터 센터 간 편차가 너무 커서 평균 에너지 사용량을 파악하기가 어려워질 수도 있습니다. 아래에 나와 있는 다양한 규모의 데이터 센터에 관한 가이드라인은 공식 규정은 아닙니다. 대신 시간이 흐르면서 비공식적으로 허가된 지침으로, 이들 시설을 전반적으로 이해하는 데 도움이 됩니다.
마이크로 데이터 센터: 이 최소 규모의 데이터 센터는 일반적으로 단일 회사 또는 원격 사무실에서 사용합니다. 마이크로 데이터 센터는 보통 10대 이하의 서버 랙으로 이루어져 있는데, 이들 서버 랙으로 사용 가능한 서버의 총량은 140대 정도입니다. 마이크로 데이터 센터가 차지하는 면적은 대개 5,000평방피트 미만입니다. 에너지 소비량은 100~150kW 미만입니다.
소규모 데이터 센터: 소규모 데이터 센터는 대개 5,000~20,000 평방피트 면적의 공간이 필요하며, 위치에 관계없이 500~2,000대의 서버를 호스팅할 수 있습니다. 에너지 소비량은 1~5MW입니다.
평균 데이터 센터: 평균 규모의 소내 데이터 센터에는 일반적으로 2,000~5,000대의 서버가 있습니다. 데이터 센터의 면적 역시 2만 평방피트에서 10만 평방피트까지 다양해집니다. 에너지 소비량은 약 100MW입니다.
하이퍼스케일 데이터 센터: 하이퍼스케일러에 대한 IDC의 정의(ibm.com 외부 링크)에 따르면, 진정한 하이퍼스케일 데이터 센터로 인정받으려면 시설에 있는 서버가 최소 5,000대여야 하고, 물리적 공간의 면적이 최소 1만 평방피트여야 합니다. 에너지 소비량은 100MW가 넘습니다.
하이퍼스케일 데이터 문제로 인해 막대한 전력 수요를 따라잡아야 하는 경우, 이러한 유형의 인프라에 거액을 투자하려는 기업들은 지리와 관련된 골칫거리를 떠안게 됩니다.
에너지 비용은 하이퍼스케일 데이터 센터의 위치에 따라 더 비싸지기도 합니다. 게다가 미개발/저개발 국가 또는 지역일수록 전기 요금이 저렴해지기 때문에, 기업이 해당 국가/지역을 하이퍼스케일 데이터센터의 건설 후보지로 물색하는 경우가 많습니다.
하지만 이 문제는 검토해야 할 기준 중 하나일 뿐입니다. 요점은 에너지원이 저렴한 지역을 찾는 것이고, 현지에서의 지속가능성을 주시하는 것도 중요합니다. 하지만 정전 및 다운타임을 일으켜 기업의 필수 직무를 저해할 수 있는 지속적이고 위험한 기상 상황이 발생하지 않을 가능성이 높은 지점을 찾는 것도 중요한 일입니다.
기업들은 하이퍼스케일 데이터 센터를 경제적으로 가동하면서 탄소 발자국을 최대한 적게 남기기 위해 자사의 계획과 지속가능성 목표 간 균형을 맞추고자 노력 중입니다. 전력 사용량을 줄이기 위한 기업들의 노력에 힘입어 하이퍼스케일 데이터 센터에 전력을 공급하기 위한 재생 에너지 솔루션의 도입이 추진되고 있습니다. 하이퍼스케일 컴퓨팅 분야의 주요 기업 중 대부분이 상당한 전력 사용량을 감당하기 위해 태양광, 풍력 등의 재생 에너지 옵션을 이미 연구했거나 현재 모색 중입니다.
일부 클라우드 서비스 제공업체의 경우 데이터 센터가 완벽한 지속가능성을 구현하도록 하겠다고 약속하기도 했습니다. 이 중 가장 우수한 기업은 2014년부터 건설적인 방안을 실천함으로써 지속가능성을 강화한 Apple(ibm.com 외부 링크)입니다. 당시 이들은 재생 에너지로만 자사의 모든 데이터 센터를 가동하는 관행을 의무화했습니다. 10년이 지난 지금도 Apple의 모든 데이터 센터는 바이오가스 연료 전지, 수력, 태양광, 풍력 등 다양한 조합의 전력으로 가동되고 있습니다.
현재로서는 데이터 유행이 멈추거나 잦아들 기미가 전혀 보이지 않습니다. 데이터 활용의 증가세가 여전히 계속되고 있음을 시사하는 증거가 실제로 많으니까요.
지금처럼 엄청나게 방대한 양의 데이터가 생성, 기록, 연구되던 시대는 없었습니다. 기술 발전이 획기적인 수준까지 이루어진 요즘, 많은 기기가 사물인터넷(IoT)을 통해 데이터를 독립적으로 생성하고 보관 및 분석 목적으로 전송할 수 있도록 단순한 장치조차도 매우 기발하게 설계되고 있습니다.
미국 싱크탱크 Synergy Research Group(정량 연구를 통해 시황을 전달함)이 2023년 10월에 발표한 연구 결과에 따르면, AI가 진화함에 따라 하이퍼스케일 데이터 센터의 처리량이 앞으로 더욱 증가할 것입니다. 특히 지금부터 2028년까지의 기간에 평균 하이퍼스케일 데이터 센터 처리량(ibm.com 외부 링크)이 3배 이상 증가할 것으로 보입니다.
하이퍼스케일 데이터 센터가 세워지면 제조업 등 다른 업종들이 활발해집니다. 서버 랙을 수천 대 제작해야 한다는 점을 생각해 보세요. 이러한 업종 중에는 초대형 시설에서 사용할 대규모의 미개발 토지를 매매하는 부동산업도 있죠. 건설업계 역시 그로 인한 수혜를 입습니다.
2024년도 Newmark 보고서(ibm.com 외부 링크)는 세계 최대 데이터 센터 및 하이퍼스케일 데이터 센터 소비 시장인 미국에 영향을 미치는 현 상황을 분석했습니다. Newmark가 알아낸 사실에 따르면, 미국 내 신규 데이터 센터의 수요는 특히 미국의 대도시와 그 주변 지역에서 현행 처리량 수준을 훨씬 넘어섰습니다.
AI와 머신 러닝을 통해 도래한 기술 발전은 더 엄청난 양의 전력을 요합니다. Newmark는 위 내용과 동일한 2024년도 보고서에서 2030년의 필수 데이터 센터 전력(ibm.com 외부 링크)이 2022년 수준인 17MW의 거의 2배에 달할 것으로 예측했습니다. 또한 Newmark는 데이터 센터들의 총 전력 사용량이 35GW에 다다를 것으로 예상합니다.
