OLAP(온라인 분석 처리)란 무엇인가요?
IBM의 SAP 솔루션 알아보기 AI 업데이트 구독하기
검정 및 파랑 배경
OLAP란 무엇인가요?

OLAP 또는 온라인 분석 처리는 데이터 웨어하우스, 데이터 레이크 또는 기타 데이터 저장소에 있는 대량의 데이터의 복잡한 쿼리 또는 다차원 분석을 고속으로 수행하기 위한 기술입니다. OLAP는 비즈니스 인텔리전스(BI), 의사 결정 지원, 다양한 비즈니스 예측 및 보고 응용 프로그램 등에 이용됩니다. 

대부분의 비즈니스 데이터에는 여러 차원, 즉 프레젠테이션, 추적 또는 분석을 위해 데이터가 분류되는 여러 범주가 있습니다. 예를 들어 판매 수치에는 위치(지역, 국가, 시/도, 매장), 시간(일, 주, 월, 년), 제품(의류, 남성/여성/아동, 브랜드, 유형) 등과 관련된 여러 차원이 있을 수 있습니다.

그러나 데이터 세트는 데이터 웨어하우스나 데이터 레이크에서 테이블에 저장되므로 각 테이블은 데이터를 한 번에 두 개의 차원으로만 구성할 수 있습니다. OLAP는 여러 관계형 데이터 세트에서 데이터를 추출하여 이를 신속한 처리와 통찰력 있는 분석이 가능한 다차원 형식으로 재구성합니다. 

Presto 학습 및 운영

데이터 분석을 위한 오픈 소스 SQL 엔진인 Presto를 시작하는 방법에 대해서는 무료 O'Reilly eBook을 살펴보세요.

관련 내용

IDC 보고서 신청

OLAP 큐브란 무엇인가요?

대부분의 OLAP 시스템의 핵심인 OLAP 큐브는 배열 기반 다차원 데이터베이스로 기존 관계형 데이터베이스보다 더 신속하고 효율적으로 다중 데이터 차원을 처리하고 분석할 수 있습니다.

관계형 데이터베이스 테이블은 개별 레코드를 2차원 행별 형식으로 저장하는 스프레드시트와 같은 구조입니다. 데이터베이스의 각 데이터 '사실'은 지역총 매출과 같은 두 차원, 즉 행과 열의 교차점에 있습니다.

SQL 및 관계형 데이터베이스 보고 도구는 테이블에 저장된 다차원 데이터를 쿼리, 보고 및 분석할 수 있지만 데이터 양이 증가함에 따라 성능이 저하됩니다. 또한 다른 차원에 초점을 맞추기 위해 결과를 재구성하는 데 많은 작업이 필요합니다.

이것이 바로 OLAP 큐브가 필요한 이유입니다. OLAP 큐브는 추가 계층으로 단일 테이블을 확장하며 각 계층은 차원(일반적으로 차원의 '개념 계층 구조'에서 다음 수준)을 추가합니다. 예를 들어 큐브의 최상위 계층은 지역별로 판매를 구성할 수 있습니다. 추가 계층은 국가, 시/도, 도시 및 특정 매장일 수도 있습니다.

이론적으로 큐브에는 무한한 수의 계층이 포함될 수 있습니다. 3차원 이상을 나타내는 OLAP 큐브를 하이퍼큐브라고도 합니다. 또한 계층 내에 더 작은 큐브가 존재할 수 있습니다. 예를 들어 각 매장 계층에는 판매원 및 제품별로 판매량을 정렬하는 큐브가 포함될 수 있습니다. 실제로 데이터 분석가는 최적의 분석 및 성능을 위해 필요한 계층만 포함하는 OLAP 큐브를 만듭니다. 

드릴 다운

드릴다운 작업은 개념 계층에서 아래로 이동하거나 큐브에 새 차원을 추가하는 두 가지 방법 중 하나를 통해 상세함이 덜한 데이터를 더 상세한 데이터로 변환합니다. 예를 들어 조직의 달력 또는 회계 분기에 대한 판매 데이터를 보는 경우 드릴다운하여 '시간' 차원의 개념 계층 구조에서 아래로 이동하여 월별 판매를 확인 수 있습니다.

롤업

롤업은 드릴다운 기능의 반대 개념으로 개념 계층에서 위로 이동하거나 차원 수를 줄임으로써 OLAP 큐브의 데이터를 집계합니다. 예를 들어 각 도시가 아닌 각 국가의 데이터를 확인하여 '위치' 차원의 개념 계층 구조에서 위로 이동할 수 있습니다.

슬라이스 앤 다이스

슬라이스 작업은 기본 OLAP 큐브에서 단일 차원을 선택하여 하위 큐브를 만듭니다. 예를 들어 조직의 첫 번째 회계 또는 달력 분기(시간 차원)에 대한 모든 데이터를 강조 표시하여 슬라이스 작업을 수행할 수 있습니다.

다이스 작업은 기본 OLAP 큐브 내에서 여러 차원을 선택하여 하위 큐브를 분리합니다. 예를 들어 조직의 달력 또는 회계 분기별(시간 차원) 및 미국 및 캐나다(위치 차원) 내의 모든 데이터를 강조 표시하여 다이스 작업을 수행할 수 있습니다.

피벗

피벗 기능은 현재 큐브 뷰를 회전하여 데이터의 새로운 표현을 표시하여 데이터의 동적 다차원 뷰를 가능하게 합니다. OLAP 피벗 기능은 Microsoft Excel과 같은 스프레드시트 소프트웨어의 피벗 테이블 기능과 비슷합니다. Excel의 피벗 테이블은 사용하기 어려울 수 있지만 OLAP 피벗은 상대적으로 쉽고(전문 지식이 덜 필요함) 응답 시간과 쿼리 성능이 더 빠릅니다.

MOLAP, ROLAP 및 HOLAP 비교

다차원 OLAP 큐브와 직접 작동하는 OLAP를 다차원 OLAP 또는 MOLAP라고 합니다. 다시 설명하자면 대부분의 경우 MOLAP는 가장 빠르고 실용적인 유형의 다차원 데이터 분석입니다.

그러나 경우에 따라 선호될 수 있는 두 가지 다른 유형의 OLAP가 있습니다.

ROLAP

ROLAP 또는 관계형 OLAP는 데이터를 먼저 큐브로 재구성하지 않고 관계형 테이블의 데이터에 직접 작동하는 다차원 데이터 분석입니다.

앞서 언급했듯이 SQL은 다차원 쿼리, 보고 및 분석을 위한 완벽한 도구입니다. 그러나 필요한 SQL Query는 복잡하고, 성능이 저하될 수 있으며 데이터의 결과 뷰는 정적이므로 다른 데이터 뷰를 나타내기 위해 피벗할 수 없습니다. ROLAP는 성능 및 유연성보다 많은 양의 데이터를 직접 처리하는 기능이 더 중요할 때 가장 적합합니다.

HOLAP

HOLAP 또는 하이브리드 OLAP는 단일 OLAP 아키텍처 내에서 관계형 데이터베이스와 다차원 데이터베이스 간에 최적의 작업 분업을 만들려고 시도합니다. 관계형 테이블에는 더 많은 양의 데이터가 포함되며 OLAP 큐브는 집계 및 예측 처리에 사용됩니다. HOLAP에는 MOLAP와 ROLAP를 모두 지원하는 OLAP 서버가 필요합니다.

HOLAP 도구는 데이터 큐브를 관계형 테이블로 '드릴스루'할 수 있으며 이를 통해 빠른 데이터 처리와 유연한 액세스를 위한 기반을 마련해 줍니다. 이 하이브리드 시스템은 더 나은 확장성을 제공할 수 있지만 관계형 데이터 소스에 액세스할 때 불가피한 속도 저하를 피할 수 없습니다. 또한 복잡한 아키텍처는 관계형 데이터베이스와 다차원 데이터베이스의 모든 데이터를 저장하고 처리해야 하므로 일반적으로 더 빈번한 업데이트 및 유지 관리가 필요합니다. 이러한 이유로 HOLAP은 더 비쌀 수 있습니다.

OLAP 및 OLTP 비교

온라인 트랜잭션 처리 또는 OLTP는 트랜잭션 지향 데이터 및 애플리케이션에 중점을 둔 데이터 처리 방법 및 소프트웨어를 말합니다. 

OLAP와 OLTP의 주요 차이점은 이름에 있습니다. OLAP는 본질적으로 분석적이고 OLTP는 트랜잭션입니다. 

OLAP 도구는 트랜잭션 데이터와 기록 데이터를 모두 포함하는 데이터 웨어하우스의 데이터를 다차원적으로 분석하도록 설계되었습니다. 실제로 OLAP 서버는 일반적으로 데이터 웨어하우징 솔루션의 중간 분석 계층입니다. OLAP의 일반적인 용도로는 데이터 마이닝 및 기타 비즈니스 인텔리전스 애플리케이션, 복잡한 분석 계산 및 예측 시나리오뿐만 아니라 재무 분석, 예산 책정 및 예측 계획과 같은 비즈니스 보고 기능이 있습니다.

OLTP는 최근 트랜잭션을 가능한 한 빠르고 정확하게 처리하여 트랜잭션 지향 애플리케이션을 지원하도록 설계되었습니다. OLTP의 일반적인 용도로는 ATM, 전자 상거래 소프트웨어, 신용 카드 결제 처리, 온라인 예약, 예약 시스템 및 기록 보관 도구가 있습니다.

이러한 접근 방식의 차이점에 대한 자세한 내용은 'OLAP 및 OLTP 비교: 차이점은 무엇인가요?를 참조하세요.

OLAP 및 클라우드 아키텍처

OLAP을 통해 기업은 데이터를 다차원 분석에 가장 실용적인 형식으로 변환하여 기업 데이터의 잠재력을 극대화할 수 있습니다. 이를 통해 귀중한 비즈니스 인사이트를 더 쉽게 식별할 수 있습니다. 그러나 이러한 시스템을 사내에 유지하면 확장 가능성이 제한됩니다.

클라우드 기반 OLAP 서비스는 비용이 저렴하고 설정하기 쉽기 때문에 예산이 부족한 중소기업이나 스타트업 기업에 더 매력적입니다. 기업은 대규모 병렬 처리(MPP)를 사용하기 때문에 탁월한 속도로 정교한 분석을 수행하는 클라우드 기반 데이터 웨어하우스의 방대한 잠재력을 활용할 수 있습니다. 따라서 기업은 클라우드 데이터 웨어하우스에서 데이터를 이동하지 않고도 방대한 양의 데이터를 분석하면서 클라우드 속도와 규모로 OLAP를 사용할 수 있습니다.

Constance Hotels, Resorts & Golf는 인도양의 섬에 9곳의 호텔을 보유한 특급 호텔 그룹입니다. 그러나 섬과 섬 사이의 커뮤니케이션 부족으로 인해 각 리조트에 비즈니스 데이터가 격리된 채로 조직 사일로가 발생했습니다. 이 조직은 클라우드 데이터 웨어하우스와 분석 아키텍처를 구축하여 모든 온프레미스 시스템과 도구를 중앙 클라우드 기반 데이터 저장소와 연결했습니다. 이를 통해 고급 예측 분석을 활용하고 OLAP 시스템 구현에 필요한 그룹 차원의 인사이트를 확보했습니다.

클라우드 아키텍처의 OLAP는 미래를 위해 구축된 빠르고 비용 효율적인 솔루션입니다. 큐브가 만들어지면 팀은 기존 비즈니스 인텔리전스 도구를 사용하여 OLAP 모델에 즉시 연결하고 클라우드 데이터에서 대화형 실시간 인사이트를 도출할 수 있습니다.

관련 솔루션
IBM Db2 Warehouse on Cloud

IBM Db2 Warehouse on Cloud는 관리형 퍼블릭 클라우드 서비스입니다. 자체 하드웨어 또는 프라이빗 클라우드를 사용하여 온프레미스에 IBM Db2 Warehouse를 설정할 수 있습니다.

IBM Db2 Warehouse on Cloud 알아보기
큐빙 서비스

IBM DB2 Warehouse는 데이터 웨어하우스 환경을 통합하고 단순화하여 동적 웨어하우징을 제공할 뿐만 아니라 데이터 웨어하우스에 대한 OLAP의 직접 지원을 제공합니다.

cubing Services 알아보기
리소스 AI에 적합한 데이터 웨어하우스를 선택하는 방법

데이터를 인사이트로 전환하여 혁신을 가속화하고 비즈니스 성과를 창출하세요.

OLAP 및 OLTP 비교: 차이점은 무엇인가요?

이 용어들은 서로 혼동되는 경우가 많습니다. 그렇다면 주요 차이점은 무엇이며 상황에 맞는 용어를 어떻게 선택해야 할까요?

다음 단계 안내

오픈 데이터 레이크하우스 아키텍처를 기반으로 특별 제작된 데이터 저장소인 IBM watsonx.data를 통해 어디서나 모든 데이터에 대한 AI 워크로드를 확장할 수 있습니다.

watsonx.data 살펴보기 라이브 데모 예약하기