사람은 많은 정보를 시각으로 얻기 때문에, 데이터 시각화는 데이터를 말하는 데에 좋은 방법입니다.
… 사람은 80% 이상의 정보를 시각을 통해 얻는다.
– Computing, Control, Information and Education Engineering, Liu, sung &yao, 2015
인간은 시각의 동물이라는 말을 들어본 적 있을 것이다. 인간은 자연적으로 시각적 입력을 다른 어떤 방법보다도 빠르게 인지하기 때문이다. 그만큼 우리에게 시각이 중요하다는 의미이기도 한데, 보통 사람이 감각기관을 통해 획득하는 정보 중 80% 이상이 시각을 통해 얻어진다고 한다. 그렇기 때문에 데이터 시각화는 우리에게 효과적일 수밖에 없다.
우리는 본능적으로 패턴을 찾는다
우리는 시각화 차트를 볼 때 가장 먼저 어떤 시각적 패턴이 있는 것은 아닌지 유심히 살핀다.
시각화 요소인 도형의 형태, 크기, 위치나 색을 근거로 시각적 패턴을 찾는다. 어떤 의도에 의한 움직임이 아니라 자연스러운 반응이다. 예를 들어, 선 차트에서는 선의 높낮이 변화 형태를 근거로 데이터의 변화 추세를 파악한다. 또 다른 값들과 구별되는 이상치가 있는지 없는지여부를 빠르게 파악하기도 한다. 마찬가지로 막대 차트, 파이 차트 등 다른 시각화 차트 모두시각화 요소의 시각적 패턴을 근거로 데이터의 의미를 파악할 수 있다.
데이터 시각화를 활용하면 데이터 분석을 위한 수학적, 통계적 전문 기술이 없어도 차트의 시각적 패턴을 근거로 누구나 쉽게 데이터 인사이트를 찾을 수 있다. 데이터 전문가뿐만 아니라 누구나 시각화를 통해 데이터를 활용할 수 있다는 의미다. 넓은 의미에서는 시각화를 활용할 때 데이터를 활용할 수 있는 사람의 범위가 넓어지므로 데이터를 기반으로 한 가치 창출의 범위가 확대된다고도 볼 수 있다.
또 정부는 민간의 데이터 활용도를 높이는 차원에서 데이터 시각화를 중심으로 한 웹 서비스 사이트를 만들어서 공개하기도 한다. 직접 데이터를 수집하고 시각화하지 않고서도 빠르게 데이터를 활용하고 인사이트를 얻을 수 있다는 점이 특징이다.
데이터 시각화는 스토리텔링에 힘을 부여한다
같은 맥락에서 데이터 시각화는 스토리텔링에도 강점이 있다. 데이터를 활용하는 사람이 시각화 차트를 통해 데이터 인사이트를 쉽고 빠르게 찾아 낼 수 있듯이 시각화 차트를 보고 정보를 수용하는 사람 역시 동일한 원리에 따라 효과적으로 데이터의 의미를 이해할 수 있다. 데이터의 의미를 전달해 상대방을 설득하고, 데이터를 통해 스토리텔링하고자 할 때 시각화를 적절히 활용하면 효과적으로 의미를 전달할 수 있다.
시각화 유형, 목적에 맞게 골라 한다
한 가지 주의해야 할 점은 정확한 데이터 인사이트 전달을 위해 어떤 형태의 시각화를 활용할 것인가를 고민해야 한다는 점이다. 자신이 전달하고자 하는 데이터 인사이트에 적합한 시각화 유형을 선택하고, 해석에 오류가 발생하지 않도록 시각화 차트를 만들어야 한다. 그렇다면 데이터 인사이트에 적합한 시각화 유형은 무엇일까? 많은 시각화 유형 중 특정 시각화 유형을 선택하는 기준은 ‘데이터를 어떤 목적으로 보여줄 것이냐’가 일반적이다.
시각화 차트 분류와 관련된 해외 자료로 앤드루 아벨라(Andrew Abela)가 고안한 차트 유형 추천 도표를 살펴보자. 여기서는 차트의 사용 목적을 비교, 관계, 분포, 구성으로 나눈다.
데이터 시각화의 가장 기본적인 목적은 데이터의 크기를 ‘비교’하는 것이다. 따라서 모든 시각화 유형은 비교를 위한다고도 할 수 있다. 그중에서도 대표적인 ‘비교’를 위한 시각화 차트는 막대 차트와 선 차트다. 이를 좀 더 세분화하면 누적 막대 차트, 그룹 막대 차트, 영역 차트 등으로 나눌 수 있다.
전체 데이터 중 특정 항목이 차지하는 ‘구성’ 비중을 보는 데 적합한 차트는 파이 차트, 100% 누적 막대 차트, 워터폴(Waterfall) 차트 등이 있다. 차트 내 구성 항목이 많을수록 차트를 구성하는 요소가 많아져 데이터를 비교하기 어렵다. 따라서 구성 비중을 표현하는 데 활용하는 시각화 차트에서는 비교 항목이 4~5개 정도인 데이터를 사용하는 것이 효과적이다.
데이터의 ‘분포’를 확인하기 위해서는 산점도, 히스토그램 등을 활용한다. 데이터 간의 관계를 보기 위해서는 산점도, 버블 차트 등의 시각화 유형을 활용한다.
뉴스젤리에서 데이터 시각화 입문서 ‘데이터가 한눈에 보이는 시각화’를 출간했습니다. 대표 저자 스스로가 비전공자로서 데이터 시각화를 배우고 활용해온 경험을 바탕으로 데이터 시각화 기초이론부터 분석 사례, 다양한 차트 유형까지 초보자도 알기 쉽게 정리했습니다. 클릭 시 구매 링크로 연결됩니다.
참고자료
- 뉴스젤리・서울신문, ‘대한민국 우울증 보고서’
- 앤드루 아벨라, 『익스트림 프레젠테이션』, 커뮤니케이션북스(2011), 120p
By 브랜드팀 강원양