#29 데이터 시각화 해외기사 – 데이터 시각화 할 때 저지르는 가장 큰 실수 7가지

On 5월 21, 2015

#29 데이터 시각화 해외기사 – 데이터 시각화 할 때 저지르는 가장 큰 실수 7가지

안녕하세요 뉴스젤리입니다.
이번기사는 데이터 시각화에 관련된 해외기사 입니다.

<TNW>

Nishith Sharma

2015년 5월 17일자 기사

데이터 시각화 할 때 저지르는 가장 큰 실수 7가지 

1. 숫자를 제대로 수치화하지 못한 경우  

당신이 파이, 스택 바 또는 스택 영역 차트를 그릴 때, 숫자는 100까지 입력해야 합니다. 여기에서 지적하는 부분이 바보처럼 들릴 수도 있겠지만, 당신이 Fox 뉴스의 이 이미지를 보면, 사람들이 얼마나 많이 이런 실수를 범하고 있는 지에 놀랄 것입니다.

 

1


 여기서 무엇이 잘못인지 알겠나요? 세 개의 원형 조각 수치는 100 %가 아닌 193%를 나타내고 있습니다. 설문 조사는 아마도 하나 이상의 응답을 허용 한 것이며, 파이 차트는 이를 명확하게 반영 할 수 있는 시각화 방식이 아닐 것입니다.

또한, 당신이 숫자를 읽지 않고 파이들의 크기만 본다면, 당신은 세 후보가 각각 3분의 1의 지지율을 가지고 있다는 느낌을 받을 것입니다. 이것도 잘못된 결론입니다.

이 실수를 방지하기 위해, 당신은 수치를 두 번 확인하고, 사용할 표준 도구를 확실히 해야 합니다. 이러한 도구들은 위와 같이 잘못된 파이차트를 만들지 않게 해줄 것입니다.

2.규칙을 따르지 않는 경우

파이 차트의 조각들이 숫자 100안에서 표현되는 것처럼, 위 아래로 이동하는 그래프(그림 참조)는 숫자로 성장을 표현하기 위한 것입니다.  당신이 아래 그림의 차트를 보았을 때, 2005년부터 2012년 사이에 무슨 일이 있는 지 알 수 있나요?

2

일반적으로 당신은 플로리다에서 2005 년부터 20012 년까지 총기 사망자가 감소했다고 생각할 것입니다. 하지만 그래프를 좀 더 유심히 관찰하면, y 축이 거꾸로 되어 있다는 것을 깨닫게 될 것입니다.  0이 맨 위에 있고 최대 값은 맨 아래에 있습니다. 이는 y 값 증가가 위에서 아래라는 일반적인 규칙을 따르지 않았기 때문에 발생하는 문제입니다.

이와 같은 실수를 방지하기 위해 특별한 것이 필요하지 않습니다. 우리는 모두 일반적인 생각과 규칙을 가지고 차트를 봅니다. 그냥 그렇게 당신도 하면 됩니다. 이런 규칙을 벗어나야 하는 사례가 생길지도 모릅니다. 하지만, 그것은 규칙이 아닌 예외가 될 것입니다.

3. 축을 과도하게 축소시킨 경우

축은 차트의 맥락을 알려줍니다. 당신이 축을 사용하는데 혼란을 느낀다면, 시각화하는 데 있어 완전히 잘못된 그림을 그리게 될 것입니다. 내가 말하는 포인트를 이해하기 위해 아래의 그래프를 한 번 봅시다.

3

Fox 뉴스는 여기서 막대 그래프의 y 축 크기를 줄였습니다. 그래서 7백만이 6백만의 세배처럼 보이게 합니다. 이는 정말 잘못된 표현입니다. 아래 그림을 통해 같은 차트의 수정된 부분을 보여드리겠습니다.

4

이게 좀 더 낫지 않나요? 이는 y 축에 데이터를 표시하고 좀 더 정확한 그림으로 수치를 보여줍니다.

여기에 같은 실수를 한 또 다른 사례가 있습니다.

5

당신이 Y 축에 대해 좀 더 신경을 쓴다면, 이런 실수를 방지할 수 있습니다.  이슈에 대해 상세보기를 표시해야 할 때, 먼저 큰 그림을 보여주고 그 다음에 특정 영역에 대한 수치를 두 번째 차트에서 표시해주면 됩니다.

 

4. 주석을 사용하지 않는 경우

사실 큰 실수는 아니지만, 당신이 차트를 그릴 때 확실히 체크할 만한 가치가 있는 것입니다. 때로는 시각화로만 보여주는 것이 충분하지 않습니다. 차트를 더 의미 있게 만들기 위해 텍스트나 숫자를 추가해야 합니다. 내가 말하는 포인트를 이해하기 위해 구글차트를 활용해서 만든 이 차트를 살펴봅시다.

6

이 차트는 적절한 제목과 축 레이블을 사용한 좋은 차트입니다. 하지만 당신은 이를 볼 때 2015년에 무슨 일이 일어났는 지 궁금할 것입니다. “대체 왜 2015년에 판매 수가 급락했지?” 라며 말입니다.

이 질문에 대답하기 위해서는 하락 이유에 대해 적절한 주석을 표시해줘야 합니다.

7

이게 더 좋지 않나요? 이를 통해 급락 발생뿐만 아니라 급락의 이유도 알 수 있습니다.

5. 부적절한 버블 크기의 사용

버블 차트는 2 차원으로 3 차원 데이터를 표시하는 데 매우 유용합니다.  당신은 X축과 Y축을 활용할 수 있을 뿐만 아니라 버블의 크기를 변화시킴으로써 그 양을 보여줄 수 있습니다.

지금까지 버블차트를 만드는 데 있어 내가 본 가장 일반적인 실수는 서로 다른 값을 표시하는 데 버블의 면적에 중점을 두는 대신 버블의 지름에 신경을 쓴다는 것입니다.  아래의 차트를 통해 설명해드리겠습니다.

8

 

여기서 잘못된 것이 몇 가지 있는 데, 이는 가장 왼쪽에 있는 두 개의 버블을 통해 알 수 있습니다.  이들은 각각 $ 0.92B와 $ 1.84B를 보여줍니다. 하지만 이게 맞는 것 같나요? 더 큰 버블이 적어도 작은 버블의 네 배는 되는 것 같습니다. 그리고  당신이 버블 내부의 내용을 읽지 못한 다면, 차트를 오해하게 될 것이라고 나는 확신합니다.

이런 실수를 피할 수 있는 쉬운 방법은 만약 당신이 데이터를 비율로 표시할 때 지름에 치중하는 것이 아닌, 면적을 신경써야 한다는 것입니다.

6.불완전한 데이터 사용

당신은 아래에 있는 지도로 시장 점유율을 많이 가지고 있는 회사 알 수 있나요?

(FusionCharts를 사용)

9

 

혼자서 위 지도를 바탕으로, 당신은 ‘ABC’가 높은 시장 점유율을 가지고 있다고 생각할 것입니다. 하지만  ‘그것은 불완전한 정보입니다’. 그 이유는 뭘까요? 우리는 확실히 ‘ABC’가 ‘XYZ’보다 미국의 더 많은 주에서 마켓 리더인 것은 알지만, 각각 주마다 두 제품의 매출의 양이 얼마인 지는 알 수 없습니다.

어쩌면, ‘ABC’는 모두 작은 시장에서 선두주자이고, ‘XYZ’는 모두 큰 시장에서 선두 주자일지 모릅니다. 그래서 더 큰 시장 점유율을 가지고 있는 회사를 알기 위해   우리는 더 많은 데이터가 필요합니다.

 

7. 비교하기 어려운 내용

당신이 기업 대표이고 현재 사업의 글로벌 입지를 다진다고 가정해봅시다. 당신은 다른 나라에서 회사의 시장 점유율을 비교하고 싶습니다. 아래의 차트를 사용해보는 것은 어떤가요?

10

DataViz는 데이터를 어렵지 않게 해석하여 작업을 해줍니다. 하지만 이 경우에 데이터를 비교하기 매우 어렵습니다. 당신은 아래의 차트가 좀 더 좋은 역할을 할 것이라 생각하지 않나요?

11

 

당신이 읽는 사람의 관점에서 생각한다면, 이 실수를 피할 수 있습니다. 아니면, 차트를 게시하기 전에 당신의 동료 또는 친구로부터 피드백 받기를 권합니다. 그들에게 ‘이 차트를 해석하는 것이 얼마나 쉽나요?”, ‘두 차트를 쉽게 비교할 수 있겠나요?’ 라고 물어보십시오. 또한, 필요하다면 ‘라벨’을 사용하는 것을 추천합니다. 위의 첫 번째 파이차트는 라벨이 없지만, 두 번째 차트는 라벨을 가지고 있습니다.

기사 원문 : http://thenextweb.com/dd/2015/05/15/7-most-common-data-visualization-mistakes/

데이터 시각화 전문 기업, 뉴스젤리 http://newsjel.ly/

빅데이터 분석을 기반으로 데이터 시각화를 통해 말랑말랑한 아이디어로

세상을 보는 데이터 스토리텔링 콘텐츠

  • By 뉴스젤리  0 Comments   
  • 데이터, 데이터스토리텔링, 시각화, 실수

    0 Comments

    Leave a Reply

    이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.

    20 − 2 =