데이터 시각화란?
데이터 시각화를 통해 이해도와 분석력을 향상하여 더 빨리 더 나은 의사 결정을 내리는 방법을 알아보세요.
IBM Planning Analytics 살펴보기
검은색과 파란색 배경
데이터 시각화란?

데이터 시각화는 차트, 플롯, 인포그래픽, 애니메이션 등 흔히 사용되는 그래픽으로 데이터를 표현하는 것입니다. 이렇게 정보를 시각적으로 표시함으로써 복잡한 데이터 간의 관계와 데이터 기반 인사이트를 이해하기 쉬운 방식으로 전달할 수 있습니다.

다양한 목적에 데이터 시각화를 사용할 수 있습니다. 또한 데이터 시각화는 데이터 팀만이 사용할 수 있는 것이 아니라는 점에 주목해야 합니다. 경영진은 데이터 시각화를 활용하여 조직의 구조와 위계 질서를 보여줄 수 있으며 데이터 분석가와 데이터 과학자는 데이터 시각화를 통해 패턴과 트렌드를 발견하고 설명할 수 있습니다. Harvard Business Review (IBM 외부 링크)는 데이터 시각화를 아이디어 생성, 아이디어 표현, 시각적 발견, 일상적 데이터비즈(dataviz)라는 네 가지 핵심 목적에 따라 분류합니다. 이에 관해서는 아래에서 더 자세히 살펴보겠습니다.

아이디어 생성

데이터 시각화는 여러 팀 사이에서 아이디어 생성을 촉발하는 데 흔히 사용됩니다. 데이터 시각화는 프로젝트를 시작할 때 브레인 스토밍 또는 디자인 씽킹 세션 중에 자주 활용되며, 다양한 관점을 제시하도록 지원하고 집단의 공통적 우려 사항을 강조합니다. 이러한 시각화는 보통 다듬어지거나 정제되지 않은 것이지만 팀이 주요 이해 관계자를 위해 해결하고자 하는 문제에 집중하도록 프로젝트의 토대를 마련하는 데 도움을 줍니다.

아이디어 표현

아이디어 표현을 위한 데이터 시각화는 전술 또는 프로세스와 같은 아이디어를 전달하는 데 도움을 줍니다. 이러한 데이터 시각화는 튜토리얼, 인증 교육 과정, 최고 교육 기관 등 학습 환경에서 흔히 사용되지만, 조직의 구조 또는 프로세스를 보여줌으로써 특정 과제를 위해 적절한 개인들 간의 커뮤니케이션을 촉진하기 위해 사용될 수 있습니다. 프로젝트 관리자는  워크플로우를 보여주기 위해 갠트 차트와 폭포 차트를 자주 사용합니다. 또한 데이터 모델링 은 개발자, 비즈니스 분석가, 데이터 설계자 및 기타 개인이 데이터베이스 또는 데이터 웨어하우스 안에서 관계를 이해할 수 있도록 추상화를 통해 기업의 정보 시스템 내부의 데이터 흐름을 보여주고 이에 대한 이해도를 높입니다.

시각적 발견

시각적 발견과 일상적 데이터비즈는 데이터 팀과 더 밀접하게 관련되어 있습니다. 시각적 발견은 데이터 분석가, 데이터 과학자, 기타 데이터 전문가가 데이터 세트의 패턴과 트렌드를 찾아내도록 도와주며, 일상적 데이터비즈는 새로운 인사이트를 발견한 후 후속 스토리텔링을 지원합니다.

데이터 시각화

데이터 시각화는 데이터 과학 프로세스의 중대한 단계로, 팀과 개인이 동료와 의사 결정권자에게 더 효과적으로 데이터를 전달하도록 돕습니다. 보고 시스템을 관리하는 팀은 일반적으로 정의된 템플릿 보기를 활용하여 성과를 모니터링합니다. 그러나 데이터 시각화는 성과 대시보드에서만 사용되지 않습니다. 예를 들면,  텍스트 마이닝  동안 분석가는 핵심 단어 시각화(word cloud)를 사용하여 비정형 데이터 안의 핵심 개념, 트렌드, 숨겨진 관계를 포착할 수 있습니다. 또는, 그래프 구조를 활용하여 지식 그래프로 개체 간의 관계를 보여줄 수도 있습니다. 다양한 유형의 데이터를 보여주는 방법은 여러 가지가 있으며, 데이터 시각화는 핵심 분석 팀이 아닌 다른 팀도 활용할 수 있는 스킬이라는 점을 기억해야 합니다.

데이터 시각화의 유형

데이터 시각화의 최초 형태는 17세기 이전 이집트인들에서 찾을 수 있습니다. 이들은 대체로 데이터 시각화를 길찾기를 위해 사용했습니다. 시간이 흐르면서 사람들은 경제, 사회, 보건 분야 등에서 더 폭넓게 데이터 시각화를 활용했습니다. 아마도 가장 주목할 만한 것은 Edward Tufte가 발간한 The Visual Display of Quantitative Information (정량적 정보의 시각적 표시)(IBM 외부 링크)일 것입니다. 이 책은 사람들이 데이터 시각화를 활용하여 더 효과적으로 데이터를 제시할 수 있음을 보여주었습니다. 이 책은 세월이 많이 흐른 지금도 건재합니다. 특히, 현재 기업들이 성과 지표를 실시간으로 보고하기 위해 대시보드에 의존하고 있기 때문입니다. 대시보드는 여러 데이터 소스의 데이터를 추적하고 시각화하는 효과적인 데이터 시각화 도구이며, 대시보드를 통해 팀 또는 옆 팀의 특정 행동이 성과에 주는 영향을 파악할 수 있습니다. 대시보드는 다음과 같은 일반적인 시각화 기법을 활용합니다.

  • 표: 표는 행과 열로 구성되며 변수를 비교하는 데 사용됩니다. 표는 구조화된 방식으로 다량의 정보를 보여줄 수 있지만, 개괄적 트렌드만을 파악하려는 사용자에게는 너무 많은 정보를 줄 수 있습니다.
  • 파이 차트 및 누적 막대 차트: 이 그래프들은 전체의 부분을 보여주는 섹션으로 나누어집니다. 이 그래프들은 데이터를 정리하고 각 구성 요소의 크기를 서로 비교할 수 있는 간단한 방법을 제공합니다.
  • 선 차트 및 면적 차트: 이 시각 자료들은 시간 경과에 따라 일련의 데이터 포인트를 선으로 연결하여 하나 이상의 항목의 변화를 보여주며, 예측 분석에서 흔히 사용됩니다. 선 그래프는 이러한 변화를 보여 주기 위해 선을 사용하며, 면적 차트는 데이터 포인트를 선으로 연결하여 변수들을 쌓아올리고 이들을 구분하기 위해 색상을 사용합니다.
  • 히스토그램: 이 그래프는 막대 차트(막대 사이에 공간이 없음)를 사용하여 수의 분포를 보여주며, 특정 범위 안의 데이터의 양을 나타냅니다. 이 시각 자료로 최종 사용자는 데이터 세트 내의 이상값을 쉽게 찾을 수 있습니다.
  • 산점도: 이 시각 자료는 두 변수 간의 관계를 보여주는 데 유용하며, 회귀 데이터 분석에서 흔히 사용됩니다. 그러나 산점도는 버블 차트와 혼동되는 경우가 있습니다. 버블 차트는 X축, Y축, 버블의 크기를 통해 세 개의 변수를 시각화하는 데 사용됩니다.
  • 히트맵:  이 그래픽은 위치별로 행동 데이터를 시각화하는 데 도움이 됩니다. 해당 위치는 지도 또는 심지어 웹페이지 상의 위치일 수 있습니다.
  • 트리맵:  일반적으로 직사각형의 중첩된 형태로 위계적 데이터를 보여줍니다. 트리맵은 면적 크기로 범주들의 비율을 비교할 때 유용합니다.
오픈소스 시각화 도구

그 어느 때보다 더 쉽게 데이터 시각화 도구를 이용할 수 있습니다. D3.js와 같은 오픈소스 라이브러리는 분석가가 데이터를 대화형 방식으로 제시할 수 있는 방법을 제공하므로 분석가는 새로운 데이터로 더 폭넓은 사람들과 상호작용할 수 있습니다. 인기가 많은 오픈소스 시각화 라이브러리의 예는 다음과 같습니다.

  • D3.js: 웹 브라우저에서 동적 대화형 데이터 시각화를 수행하기 위한 프런트엔드 JavaScript 라이브러리입니다. D3.js (IBM 외부 링크)는 HTML, CSS 및 SVG를 사용하여 어느 브라우저에서나 볼 수 있도록 데이터를 시각적으로 표현합니다. 또한 이 라이브러리는 상호작용 및 애니메이션을 위한 기능을 제공합니다.
  • ECharts: 강력한 차트 작성 및 시각화 라이브러리로, 제품, 연구 논문, 프레젠테이션 등에 직관적이며 맞춤화 가능성이 뛰어난 대화형 차트를 추가하는 쉬운 방법을 제공합니다. Echarts (IBM 외부 링크)는 JavaScript와 경량 캔버스 라이브러리인 ZRender를 기반으로 합니다.
  • Vega: Vega (IBM 외부 링크)는 스스로를 “시각화 문법”으로 정의하며 웹에서 액세스 가능한 대규모 데이터 세트에 대한 맞춤화된 시각화를 지원합니다.
  • deck.gl: 이 라이브러리는 Uber의 오픈소스 시각화 프레임워크 제품군의 일부입니다. deck.gl (IBM 외부 링크)은 빅데이터에 대한  탐색적 데이터 분석 에 사용되는 프레임워크입니다. 이 라이브러리는 웹 기반의 고성능 GPU 지원 시각화를 구축하도록 돕습니다.
데이터 시각화 베스트 프랙티스

이용 가능한 데이터 시각화 도구가 너무 많기 때문에 효과적이지 않은 정보 시각화 또한 증가했습니다. 대상 사용자가 의도된 인사이트 또는 결론에 도달하도록 데이터 시각화를 수행하려면 시각적 커뮤니케이션은 단순하면서 계획적이어야 합니다. 다음과 같은 베스트 프랙티스를 따르면 유용하면서 명쾌한 데이터 시각화를 수행하는 데 도움이 될 수 있습니다.

컨텍스트 설정: 특정 데이터 포인트가 중요한 이유를 대상 사용자에게 이해시키기 위해 일반적인 배경 정보를 제공하는 것이 중요합니다. 예를 들어, 이메일 확인율이 낮을 경우 회사의 확인율을 전체 산업의 확인율과 비교한 후 회사의 마케팅 채널에 문제가 있음을 보여주는 것이 좋을 것입니다. 조치를 취하려면 대상 사용자는 목표, 벤치마크 또는 기타 핵심 성과 지표(KPI) 등 가시적인 기준과 비교하여 현재 성과가 어떤지 이해해야 합니다.

대상 사용자 이해하기: 누구를 위해 시각화를 설계했는지 생각해보고 이들의 요구 사항에 맞게 데이터 시각화를 수행합니다. 그 사람이 성취하고자 하는 것은 무엇입니까? 이들은 어떤 질문에 관심이 있습니까? 시각화가 이들의 우려 사항을 해결해 줍니까? 사람들에게 동기를 부여하기 위해 여러분이 제공하는 데이터는 이러한 대상의 역할 범위 내에서 유용해야 합니다. 시각화가 명쾌한지 잘 모르겠는 경우 대상 사용자 중 한두 명에게 시각화를 보여주고 피드백을 받으십시오. 그리고 대규모 프레젠테이션을 수행하기 전에 추가로 편집 작업을 수행하십시오.

효과적인 시각 자료 선택: 특정 유형의 데이터 세트에 적합한 특정 시각 자료가 있습니다. 예를 들면, 산점도는 두 변수 간의 관계를 잘 보여주며, 선 그래프는 시계열 데이터를 잘 보여줍니다. 시각 자료가 주요 요점을 대상에게 이해시키는 데 도움이 되는지 확인하십시오. 차트와 데이터를 잘못 배치하면 대상 사용자에게 명쾌한 이해를 제공하는 대신 대상 사용자를 더 혼란스럽게 하여 반대의 결과가 나타날 수 있습니다.

단순화: 데이터 시각화 도구로 시각 자료에 모든 종류의 정보를 쉽게 추가할 수 있습니다. 그러나, 많은 정보를 추가할 수 있다고 해서 많은 정보를 추가해야 한다는 의미는 아닙니다! 데이터 시각화를 수행할 경우 사용자의 관심을 집중시키려면 추가하는 정보를 매우 신중하게 선택해야 합니다. 예를 들면, 막대 차트에서 모든 막대에 데이터에 대한 설명을 추가해야 할까요? 전달하고자 하는 요점을 보여주기 위해 하나 또는 두 개의 막대에만 설명을 추가하면 될 것입니다. 아이디어를 전달하기 위해 다양한 색상을 사용해야 할까요? 다양한 대상이 식별할 수 있는 색상을 사용하고 있습니까(예: 색맹인 대상을 고려했습니까)? 대상의 주의를 산만하게 할 수 있는 정보를 제외하여 데이터 시각화의 영향력이 극대화되도록 설계하십시오.

관련 솔루션
Cognos Analytics

더 스마트한 분석과 신뢰할 수 있는 의사 결정을 지원하는 신뢰받는 Watson 코파일럿.

Cognos Analytics 살펴보기
Planning Analytics

수동 계획의 한계를 넘어설 수 있도록 도움을 주는 AI 기반의 통합 계획 솔루션입니다.

Planning Analytics 살펴보기
IBM Watson® Studio

AI 모델을 구축, 실행 및 관리합니다. 오픈 소스 코드 또는 비주얼 모델링을 사용하여 임의의 클라우드에서 데이터를 준비하고 모델을 구축합니다. 결과를 예측하고 최적화합니다.

IBM Watson® Studio 살펴보기
다음 단계

시중에 다양한 데이터 시각화 도구가 있지만 Cognos Analytics는 IBM의 비즈니스 인텔리전스 및 데이터 시각화 도구입니다. Cognos Analytics의 셀프 서비스 플랫폼은 인공지능 및 머신 러닝을 포함한 코그너티브 컴퓨팅 기술을 통합하므로 조직은 손쉽게 데이터를 시각화하고 새로운 인사이트를 공유하고 데이터 기반 의사 결정을 장려할 수 있습니다.

지금 IBM Cognos® Analytics 살펴보기