매일 보고, 생각하고, 만드는 데이터 시각화, 한 번에 정리할 순 없을까?
‘우리가 알고 있는 차트는 도대체 얼마나 될까?’, ‘어떤 것들이 있고, 몇 가지나 될까?’, ‘이들을 정리할 순 없을까?’. 매일 같이 데이터를 옆에 끼고, ‘어떤 형태로 시각화 하는 것이, 의도한 바를 정확히 전달할 수 있을까’란 고민을 달고 사는 우리는, 끝내 세상의 모든 차트를 정리해보기로 했다.
직접 정리하기에 앞서 해외 사례를 리서치, 각 사례별로 어떤 기준에 의해 차트를 분류 하였는지 살펴보았다.
1. Visual vocabulary
‘Visual Vocabulary’는 총 64개의 차트를 9개 분류로 나누었다. 9개의 분류 기준은 Deviation, Corrleation, Ranking, Distribution, Change over time, Part-to-whole, Magnitude, Spatial, Flow이다. 시각화 유형의 제작자가 어떤 의도를 가지고 시각화 하는지 그 분류를 세분화 한 것으로 보인다. 각 차트별로는 간단한 설명이 있고, 분류별 컬러를 동일하게 사용한 동시에 심플한 레이아웃으로 가독성이 좋다.(예쁘다)
2. The Graphic Continuum
‘The Graphic Continuum’는 총 74개 차트를 6개 분류로 나누었다. 각 분류 기준은 Distribution, Time, Comparing categories, Geospatial, Part-to-whole, Relationship이다. 첫번째 사례로 본 ‘Visual Vocabulary’에서 ‘Ranking’, ‘Magnitude’ 분류의 차트가 해당 사례에서는 ‘Comparing categories’ 안에 포함되고, ‘Corrleation’, ‘Flow’ 분류의 차트는 ‘Relationship’ 안에 포함되었다. 첫번째 사례에 비해 분류 기준 수가 적고 비교적 그 의미가 독립적이어서 이해하기 쉽다. 두 가지 분류에 모두 속하는 차트의 경우 이를 선으로 연결한 것이 특징이나, 읽기에 복잡한 느낌이 든다.
3. The Data Visualisation Catalogue
‘The Data Visualisation Catalogue’은 앞서 살펴본 두가지 사례가 포스터 형태의 결과물인 것과 달리, 웹사이트 내에서 차트를 검색할 수 있고, 각 차트에 대한 정보를 페이지로 제공하는 것이 가장 큰 차별점이다.
해당 웹사이트에서는 차트의 ‘기능’(분류)을 기준으로하거나 차트 이름의 ‘목록’을 기준으로 차트를 찾아볼 수 있다. 차트의 ‘기능’ 수는 총 12가지로 Comparisons, Proportions, Relationships, Hierarchy, Concepts, Location, Part-to-a-whole, Distribution, How things work, Processes & methods, Movement or flow, Patterns, Range, Data over time, Analysing text, Reference tool 이다. 각 분류를 선택하면 그 안에서도 세부 분류에 따라 차트가 나뉘어 있음을 확인할 수 있다. 더불어 위에서 살펴본 타 사례의 분류 기준으로 볼 수 없었던 Hierarchy, Analysing text 등을 확인할 수 있으며, 하나의 차트는 한 가지 이상의 ‘기능’ 분류를 태그로 달고 있음을 볼 수 있다.
또한 각 차트의 페이지에서는 차트에 대한 설명과, 차트 구조에 대한 설명이 자세하게 나와있다.
우리는 어떤 기준으로 차트를 정리해볼까?
1.차트 보카 데이(Chart Voca DAY)
위에서 살펴본 사례들의 공통점은 차트의 기능 혹은 사용자의 의도(시간 변화에 따른 추이를 보여줄 것인지, 비교할 것인지, 비중을 보여줄 것인지 등)를 기준으로 차트를 분류한 점을 들 수 있다. 그런데, 실제 데이터 시각화 작업시에는 시각화로 전달하고자 하는 의도를 기반으로 시각화 유형을 먼저 선택하는 것이 아닌, 사용할 데이터 필드를 먼저 선택하고, 그 이후에 해당 데이터로 그릴 수 있는 차트가 무엇이 있는지, 어떤 차트가 효과적인 것인지에 대한 고민을 하게 된다. 그래서 우리는 데이터 필드의 유형(type)을 활용해 차트를 분류해보기로 했다.
데이터의 필드(혹은 attribute)의 유형은 크게 범주(차원, Dimension), 수치(값, Measure)로 나눌 수 있다. 범주형 필드는 카테고리컬한 정보를 갖고 있는 것으로 예를 들어 ‘남자’, ‘여자’의 값을 갖는 ‘성별’ 필드가 있다. 수치형 필드는 말 그대로 숫자로 된 값을 갖고 있는 필드를 의미한다. 시각화 차트는 이 둘의 조합을 어떻게 하느냐에 따라서 다양한 유형으로 표현된다.
예를 들어 모바일 게임별 종합점수라는 차트를 그린다고 가정해보자. 해당 차트를 그리기 위해서는 모바일 게임 이름이 포함된 ‘모바일 게임명’ 필드와 각 모바일 게임별 ‘종합점수’ 필드를 가진 데이터가 필요하다. 여기에서 ‘모바일 게임명’ 필드는 범주형에 속하며, ‘종합점수’는 수치형에 속한다. 범주형 필드 1개와 수치형 필드 1개로 그릴 수 있는 차트는 대표적으로 막대(bar, column), 트리맵(treemap), 버블(bubble) 차트가 있다. 이 세 개의 차트 모두 수치형 필드 값으로 길이 혹은 크기(면적)를 다르게 하고, 이를 범주형 필드 값으로 구분해서 보는 공통점을 가진다. 동일한 데이터 필드의 조합으로 그릴 수 있는 다양한 유형의 차트 중에 어떤 것을 선택할 것인가는 제작자에게 달려있다.
우리가 정리할 차트는 앞서 살펴본 해외 사례에 포함된 차트를 그 대상으로 하였다. ‘Visual Vocabulary’ 사례의 차트를 기본으로 하고, 나머지 두 사례(The Graphic Continuum, The Data Visualisation Catalogue)를 참고로 하였다.
가장 먼저 차트를 분류할 큰 카테고리를 결정했다. 각 차트의 모양을 기본으로 하였는데, 이는 직관적으로 차트의 차이를 구분하는데 가장 효과적이라고 판단하였기 때문이다. 막대(Bar), 선(line), 산점도(scatter), 히트맵(heatmap), 네트워크(network), 기타(etc)로 큰 카테고리를 나누고, 각 카테고리 안에 포함되는 차트를 분류하였다.
1차적으로 큰 카테고리 안에 다수의 차트를 분류한 이후에는, 개별 차트들을 살펴보면서 ‘차트의 이름과 그 정의는 무엇인지’, ‘어떠한 상황에서 사용되는지’, ‘해당 차트를 그리기 위해 필요한 데이터 필드의 조합은 무엇인지’ 등을 논의하였다. 특히 ‘데이터 필드의 조합’에 집중하여 결과적으로는 범주형 필드 n개(Dn) 혹은 수치형 필드 n개(Mn)의 조합별로 그릴 수 있는 차트를 구분하였다.
이 과정을 통해 차트를 분류한다는 1차적 목표를 달성한 것 외에 사전에 몰랐던 유형의 차트를 알게 되기도 하고, 서로 다른 이름 혹은 형태로 보이나 사실상 동일한 데이터 필드 조합에 의한 차트들도 알 수 있었다. 결과적으로 우리가 정리한 차트는 6개의 분류 아래 63개 차트를 포함하며 각 차트는 데이터 필드 정보를 갖는다.
2. 차트 위키 데이(Chart Wiki DAY)
‘차트 보카 데이’에서 정리한 차트는 어떻게 해야 할까? 차트를 분류하면서 차트 유형과 데이터에 대한 이해를 높일 수 있었던 것에서 나아가, 이를 꾸준히 활용할 수 있는 방안을 고민했다. 결론적으로 차트가 궁금할 때마다 언제든 찾아 볼 수 있는 위키를 만들기로 했다.
가장 먼저 ‘차트 보카 데이’의 결과를 스프레드시트 형태로 정리했다. 카테고리, 데이터 필드 정보, 차트 이름을 작성했다. 동일한 차트임에도 불리는 명칭이 여러개 였던 차트가 있었던 것을 고려해 ‘유사이름’ 필드를 추가하였다. 또한 해당 차트를 활용한 콘텐츠 사례를 리서치하여 정리하였다. 이는 데이터 시각화를 제작하는 사람의 관점에서 고려해야 할 정보로 ‘어떠한 의도로, 어떠한 상황에, 어떤 시각화 차트를 사용하는지’에 대한 예로 참고하기 위함이다.
위 자료를 기반으로 사내 깃헙(github)에 위키(Wiki)를 만들었다. 위키로 만든 이유는 꾸준히 정보를 업데이트하는데 용이하다는 판단에 의한 것으로 전체 카테고리 페이지, 카테고리별 페이지, 차트별 페이지를 각각 만들어 링크로 연결하였다.
차트별 개별 페이지에는 위 시트의 정보(차트 이름, 유사이름, 데이터 필드 구조)들을 넣고, 사례는 기본 구조를 보여줄 수 있는 대표 사례와 이를 활용한 콘텐츠의 응용사례 2가지를 추가하였다. 이 과정에서 중복이 있는 차트 등을 재정리하여 최종적으로 6개 분류 58개의 차트를 정리하였다. 이번에 차트 위키로 정리한 차트의 경우 필요시 추가 정보를 업데이트 할 예정이며, 신규로 추가해야 하는 차트 유형이 있다면 이를 더하는 등의 방식으로 차트 위키에 대한 업데이트를 이어나갈 계획이다.
세상의 모든 차트? 알 수 없기 때문에 더 매력적인 데이터 시각화!
다양한 차트를 정리하면서 가장 처음 느꼈던 점은 ‘세상에… 이렇게 많은 차트가 있다니!’였다. 비슷한듯 전혀 다른 차트도 있었고, 달라 보이지만 데이터 구조를 살펴보면, 다르지 않은 차트도 있었다. 똑같은 차트여도 부르는 이름이 다르기도 했고, 분류하는 주체에 따라 다르게 분류되기도 했다.
우리가 알고 있는 많은 차트들을 한 번 정리해보자는 의도로 시작된 ‘차트 보카 데이’를 통해 각각의 차트에 대한 이해 뿐만 아니라, ‘데이터 필드를 어떻게 조합하느냐에 따라서 시각화 유형이 어떻게 달라지는가’, ‘독자에게 전달하고자 하는 핵심 메시지에 따라서 선택해야 하는 차트 유형은 달라진다’라는 점을 명확하게 이해할 수 있었다.
더불어 ‘차트 위키 데이’에서 각 차트를 활용한 다양한 콘텐츠를 리서치하면서, 기본적인 차트 유형을 어떻게 응용할 수 있는지, 어떤면에서 효과적인지를개별적으로 파악할 수 있었다. 찾고 찾고, 또 찾아도 다양한 사례의 콘텐츠를 만날 때마다 세상의 모든 차트를 아는 것은 불가능함을 느끼게 되었다. 이는 동시에 기본 차트를 응용해서 만들 수 있는 시각화에 한계가 없다는 것을 의미했고, 그 점이 더욱 매력적으로 느껴졌다.
앞으로 우리가 만드는 데이터 시각화는 어떤 모습일까?
앞으로를 더 기대하게 만든, 차트 위키 제작 스토리를 마무리한다.
* 뉴스젤리 콘텐츠팀의 ‘차트 위키’ 스프레드시트 결과물은 “링크“를 통해 확인해 볼 수 있다.
By 콘텐츠팀 강원양