데이터 시각화는 차트, 플롯, 인포그래픽, 애니메이션 등 흔히 사용되는 그래픽으로 데이터를 표현하는 것입니다. 이렇게 정보를 시각적으로 표시함으로써 복잡한 데이터 간의 관계와 데이터 기반 인사이트를 이해하기 쉬운 방식으로 전달할 수 있습니다.
다양한 목적에 데이터 시각화를 사용할 수 있습니다. 또한 데이터 시각화는 데이터 팀만이 사용할 수 있는 것이 아니라는 점에 주목해야 합니다. 경영진은 데이터 시각화를 활용하여 조직의 구조와 위계 질서를 보여줄 수 있으며 데이터 분석가와 데이터 과학자는 데이터 시각화를 통해 패턴과 트렌드를 발견하고 설명할 수 있습니다. Harvard Business Review (IBM 외부 링크)는 데이터 시각화를 아이디어 생성, 아이디어 표현, 시각적 발견, 일상적 데이터비즈(dataviz)라는 네 가지 핵심 목적에 따라 분류합니다. 이에 관해서는 아래에서 더 자세히 살펴보겠습니다.
데이터 시각화는 여러 팀 사이에서 아이디어 생성을 촉발하는 데 흔히 사용됩니다. 데이터 시각화는 프로젝트를 시작할 때 브레인 스토밍 또는 디자인 씽킹 세션 중에 자주 활용되며, 다양한 관점을 제시하도록 지원하고 집단의 공통적 우려 사항을 강조합니다. 이러한 시각화는 보통 다듬어지거나 정제되지 않은 것이지만 팀이 주요 이해 관계자를 위해 해결하고자 하는 문제에 집중하도록 프로젝트의 토대를 마련하는 데 도움을 줍니다.
아이디어 표현을 위한 데이터 시각화는 전술 또는 프로세스와 같은 아이디어를 전달하는 데 도움을 줍니다. 이러한 데이터 시각화는 튜토리얼, 인증 교육 과정, 최고 교육 기관 등 학습 환경에서 흔히 사용되지만, 조직의 구조 또는 프로세스를 보여줌으로써 특정 과제를 위해 적절한 개인들 간의 커뮤니케이션을 촉진하기 위해 사용될 수 있습니다. 프로젝트 관리자는 워크플로우를 보여주기 위해 갠트 차트와 폭포 차트를 자주 사용합니다. 또한 데이터 모델링 은 개발자, 비즈니스 분석가, 데이터 설계자 및 기타 개인이 데이터베이스 또는 데이터 웨어하우스 안에서 관계를 이해할 수 있도록 추상화를 통해 기업의 정보 시스템 내부의 데이터 흐름을 보여주고 이에 대한 이해도를 높입니다.
시각적 발견과 일상적 데이터비즈는 데이터 팀과 더 밀접하게 관련되어 있습니다. 시각적 발견은 데이터 분석가, 데이터 과학자, 기타 데이터 전문가가 데이터 세트의 패턴과 트렌드를 찾아내도록 도와주며, 일상적 데이터비즈는 새로운 인사이트를 발견한 후 후속 스토리텔링을 지원합니다.
데이터 시각화는 데이터 과학 프로세스의 중대한 단계로, 팀과 개인이 동료와 의사 결정권자에게 더 효과적으로 데이터를 전달하도록 돕습니다. 보고 시스템을 관리하는 팀은 일반적으로 정의된 템플릿 보기를 활용하여 성과를 모니터링합니다. 그러나 데이터 시각화는 성과 대시보드에서만 사용되지 않습니다. 예를 들면, 텍스트 마이닝 동안 분석가는 핵심 단어 시각화(word cloud)를 사용하여 비정형 데이터 안의 핵심 개념, 트렌드, 숨겨진 관계를 포착할 수 있습니다. 또는, 그래프 구조를 활용하여 지식 그래프로 개체 간의 관계를 보여줄 수도 있습니다. 다양한 유형의 데이터를 보여주는 방법은 여러 가지가 있으며, 데이터 시각화는 핵심 분석 팀이 아닌 다른 팀도 활용할 수 있는 스킬이라는 점을 기억해야 합니다.
데이터 시각화의 최초 형태는 17세기 이전 이집트인들에서 찾을 수 있습니다. 이들은 대체로 데이터 시각화를 길찾기를 위해 사용했습니다. 시간이 흐르면서 사람들은 경제, 사회, 보건 분야 등에서 더 폭넓게 데이터 시각화를 활용했습니다. 아마도 가장 주목할 만한 것은 Edward Tufte가 발간한 The Visual Display of Quantitative Information (정량적 정보의 시각적 표시)(IBM 외부 링크)일 것입니다. 이 책은 사람들이 데이터 시각화를 활용하여 더 효과적으로 데이터를 제시할 수 있음을 보여주었습니다. 이 책은 세월이 많이 흐른 지금도 건재합니다. 특히, 현재 기업들이 성과 지표를 실시간으로 보고하기 위해 대시보드에 의존하고 있기 때문입니다. 대시보드는 여러 데이터 소스의 데이터를 추적하고 시각화하는 효과적인 데이터 시각화 도구이며, 대시보드를 통해 팀 또는 옆 팀의 특정 행동이 성과에 주는 영향을 파악할 수 있습니다. 대시보드는 다음과 같은 일반적인 시각화 기법을 활용합니다.
그 어느 때보다 더 쉽게 데이터 시각화 도구를 이용할 수 있습니다. D3.js와 같은 오픈소스 라이브러리는 분석가가 데이터를 대화형 방식으로 제시할 수 있는 방법을 제공하므로 분석가는 새로운 데이터로 더 폭넓은 사람들과 상호작용할 수 있습니다. 인기가 많은 오픈소스 시각화 라이브러리의 예는 다음과 같습니다.
이용 가능한 데이터 시각화 도구가 너무 많기 때문에 효과적이지 않은 정보 시각화 또한 증가했습니다. 대상 사용자가 의도된 인사이트 또는 결론에 도달하도록 데이터 시각화를 수행하려면 시각적 커뮤니케이션은 단순하면서 계획적이어야 합니다. 다음과 같은 베스트 프랙티스를 따르면 유용하면서 명쾌한 데이터 시각화를 수행하는 데 도움이 될 수 있습니다.
컨텍스트 설정: 특정 데이터 포인트가 중요한 이유를 대상 사용자에게 이해시키기 위해 일반적인 배경 정보를 제공하는 것이 중요합니다. 예를 들어, 이메일 확인율이 낮을 경우 회사의 확인율을 전체 산업의 확인율과 비교한 후 회사의 마케팅 채널에 문제가 있음을 보여주는 것이 좋을 것입니다. 조치를 취하려면 대상 사용자는 목표, 벤치마크 또는 기타 핵심 성과 지표(KPI) 등 가시적인 기준과 비교하여 현재 성과가 어떤지 이해해야 합니다.
대상 사용자 이해하기: 누구를 위해 시각화를 설계했는지 생각해보고 이들의 요구 사항에 맞게 데이터 시각화를 수행합니다. 그 사람이 성취하고자 하는 것은 무엇입니까? 이들은 어떤 질문에 관심이 있습니까? 시각화가 이들의 우려 사항을 해결해 줍니까? 사람들에게 동기를 부여하기 위해 여러분이 제공하는 데이터는 이러한 대상의 역할 범위 내에서 유용해야 합니다. 시각화가 명쾌한지 잘 모르겠는 경우 대상 사용자 중 한두 명에게 시각화를 보여주고 피드백을 받으십시오. 그리고 대규모 프레젠테이션을 수행하기 전에 추가로 편집 작업을 수행하십시오.
효과적인 시각 자료 선택: 특정 유형의 데이터 세트에 적합한 특정 시각 자료가 있습니다. 예를 들면, 산점도는 두 변수 간의 관계를 잘 보여주며, 선 그래프는 시계열 데이터를 잘 보여줍니다. 시각 자료가 주요 요점을 대상에게 이해시키는 데 도움이 되는지 확인하십시오. 차트와 데이터를 잘못 배치하면 대상 사용자에게 명쾌한 이해를 제공하는 대신 대상 사용자를 더 혼란스럽게 하여 반대의 결과가 나타날 수 있습니다.
단순화: 데이터 시각화 도구로 시각 자료에 모든 종류의 정보를 쉽게 추가할 수 있습니다. 그러나, 많은 정보를 추가할 수 있다고 해서 많은 정보를 추가해야 한다는 의미는 아닙니다! 데이터 시각화를 수행할 경우 사용자의 관심을 집중시키려면 추가하는 정보를 매우 신중하게 선택해야 합니다. 예를 들면, 막대 차트에서 모든 막대에 데이터에 대한 설명을 추가해야 할까요? 전달하고자 하는 요점을 보여주기 위해 하나 또는 두 개의 막대에만 설명을 추가하면 될 것입니다. 아이디어를 전달하기 위해 다양한 색상을 사용해야 할까요? 다양한 대상이 식별할 수 있는 색상을 사용하고 있습니까(예: 색맹인 대상을 고려했습니까)? 대상의 주의를 산만하게 할 수 있는 정보를 제외하여 데이터 시각화의 영향력이 극대화되도록 설계하십시오.
더 스마트한 분석과 신뢰할 수 있는 의사 결정을 지원하는 신뢰받는 Watson 코파일럿.
수동 계획의 한계를 넘어설 수 있도록 도움을 주는 AI 기반의 통합 계획 솔루션입니다.
AI 모델을 구축, 실행 및 관리합니다. 오픈 소스 코드 또는 비주얼 모델링을 사용하여 임의의 클라우드에서 데이터를 준비하고 모델을 구축합니다. 결과를 예측하고 최적화합니다.