안녕하세요 뉴스젤리입니다.
이번기사는 데이터 시각화에 관련된 해외기사 입니다.
(기사원문: http://goo.gl/YTmUZZ)
2015년 6월 26일 수정 기사
데이터 시각화 101: 버블 차트 BY. BENJAMIN STARR
저희의 ‘데이터 시각화 101시리즈’에서 저희는 각 차트의 종류를 다루어 여러분의 데이터 시각화 기술에 도움이 되고자 합니다.
지금까지 저희의 시리즈에서 우리는 2차원의 데이터를 명확하게 나타내는 것을 다루어 왔습니다. 하지만 만약 데이터가 3차원 또는 4차원이라면 어떻게 할까요? 서로 다른 변수들을 설명하기 위하여 막대 차트를 이용하시나요? 여러 개의 그래프를 그려서 결과를 비교하시나요?
버블차트를 소개합니다. 버블차트는 놀라울 정도로 다목적으로 이용할 수 있습니다. 2차원 또는 4차원의 데이터 세트를 보기 좋고 해석하기에 간단한 하나의 차트로 시각화하는데 사용될 수 있습니다.
버블차트란?
가장 간단한 형태로, 버블 차트는 2차원의 데이터를 표현합니다: 한 데이터는 동그란 버블의 크기로 시각화되는 수치 데이터이고, 다른 데이터는 버블 차트가 나타내고자 하는 대상입니다. 간단하게 말해서, 큰 버블은 큰 값을 의미합니다.
이전에 매우 유용하기로 소개되었던 산점도를 기억하시나요? 버블 차트는 심지어 산점도에 기능을 더해줍니다. 서로 다른 크기의 버블을 표준 산점도의 x, y축과 결합하면 매우 가치 있는 3차원의 데이터를 만들어낼 수 있습니다. 이러한 차트는 대개 “버블 플롯”이라고 불립니다.
네 번째 차원의 데이터는 아래의 차트에 나타나 있습니다. 서로 다른 색을 사용하여 데이터를 항목별로 정리(심지어 명도를 조절하여 수치를 나타냅니다)할 수 있는 것에서 버블플롯이 얼마나 유용한지 알 수 있습니다.
버블 차트를 또 다르게 사용하는 방법은 (카토그램으로도 불리는) ‘버블 지도’입니다. 여기서 x축과 y축의 값은 지리적 위치를 나타내는 효과적인 위도와 경도 좌표입니다. (비록 위치의 정확성이 제일 중요한 것은 아니지만 버블의 경계선은 도시의 경계처럼 버블을 완벽하게 정의하는 요소입니다.)
버블차트의 유래
버블차트는 산점도와 마찬가지로 기원이 알려지지 않았습니다. 하지만 버블 지도는 프랑스의 토목기사인 Charles Joseph Minard (1781-1870)가 성공적으로 사용했습니다. 비록 그가 버블 지도를 사용한 첫 번째 사람인지 알 수는 없지만, 그의 버블지도는 (시대가 지나면서 노랗게 변색된 것만 제외한다면) 우리가 오늘날 발견할 수 있는 다른 버블지도들과 거의 유사합니다. Minard는 심지어 프랑스의 소 거래를 나타낸 그의 지도에서 최초로 버블 지도와 파이 차트의 조합을 창조해냈습니다.
1859년 Minard의 “유럽의 주요 항구와 강의 총 톤수에 관한 비유적이고 근사적인 지도”를 통해서, 우리는 버블 지도의 완벽한 형태를 볼 수 있습니다. (또한 강의 두께의 1mm가 10만 톤의 선적을 나타낸다는 사실에서 Minard가 버블 지도 제작의 달인이었다는 사실을 알 수 있습니다.)
언제 이용하면 좋을까?
우리는 산점도를 “발견의 도구”라고 불렀습니다. 하지만 버블 차트는 산점도를 그 다음 단계로 나아가게 합니다. 아래는 데이터 차원 별 사용 방법의 예시입니다.
두 개의 데이터 세트
이 버블 차트는 보기에 좋고 간단합니다. 이 경우에 각 버블의 면적은 개인의 사회적 네트워크 퍼센트를 나타내고, 범례는 그 개인들의 연령대를 나타냅니다. (이 차트는 미적으로 훌륭하다는 점에서 막대 차트의 좋은 대체재가 될 수 있습니다.)
세 개의 데이터 세트
이 버블 플롯은 표준 산점도의 장점을 버블의 크기에서 알 수 있는 추가적인 데이터와 결합한 것입니다. 여기서 우리는 1년 간의 데이터를 바탕으로 광고에 투자를 많이 할수록 판매가 늘어난다는 명확한 상관관계를 볼 수 있습니다.
네 개의 데이터 세트
각 버블을 구별 짓는 범례를 추가하면 네 개의 데이터 세트를 한꺼번에 그리는 것이 가능해집니다. 최근의 버블 플롯 중 가장 유명한 사례는 스웨덴 연구원인 Hans Rosling의 ‘유달리 재밌는 TED 강의’입니다. 그의 “GapMinder”이라는 웹사이트에서 지난 200년 간의 세계 각 국의 기대 수명을 1인당 국민 소득 및 총 인구수와 비교하는 버블 차트를 보여주었습니다. 상호작용하는 년도에 따라 스크롤을 좌우로 움직이면 수명의 역사를 볼 수 있습니다. 예를 들어 1918년 스페인의 유행성 플루나 세계 무역의 성장 등 세계를 움직이는 사건들은 분명하게 드러납니다. 이는 진정한 차트의 경지라고 할 수 있습니다:
버블 차트를 그리는 가장 좋은 연습
버블 차트를 만들어볼 준비가 되셨나요? 가장 중요한 정보를 한눈에 파악할 수 있게끔 해주는 3가지의 팁이 있습니다. (여러분은 저희의 산점도에 관한 팁도 다시 보고 적용할 수 있습니다.)
1) 라벨을 눈에 보이도록 만들어라
모든 라벨은 다른 요소에 의해 가려지면 안되고 해당하는 버블과 명확하게 상응해야 합니다.
2) 버블의 크기를 알맞게 조정해라
사람의 시신경계는 본능적으로 원의 면적으로 원의 크기를 인식합니다. 따라서 버블은 지름이 아닌 면적으로 측정되어야 합니다.
3) 이상한 모양을 사용하지 말아라
지나친 세부사항을 추가하거나 전체적으로 둥근 모양이 아닌 것을 사용하지 마십시오; 이것으로 인해 차트가 부정확해질 수 있습니다.
*****기사 원문의 링크를 통해 다른 시각화 차트에 관한 기사를 보실 수 있습니다.
데이터 시각화 전문 기업, 뉴스젤리 http://newsjel.ly/
빅데이터 분석을 기반으로 데이터 시각화를 통해 말랑말랑한 아이디어로
세상을 보는 데이터 스토리텔링 콘텐츠
페이스북 주소 : www.facebook.com/newsjelly