< 부산소녀의 데이터 시각화 도전기 >
Episode 1 : 데이터 시각화, 왜 필요한걸까?
안녕하세요!
앞으로 여러분과 데이터 시각화 도전기를 함께할 ‘부산소녀’입니다^_^
우선 저는 부산에서 나고 자라 20년 넘게 부산에서 거주하다
대학에서 경제학을 공부한 뒤
최근 데이터 시각화 전문 기업에서 일을 하게 되었어요.
지금 ‘데이터 시각화? 그게 뭐지?…’
하고 계실 여러분들 표정이 그려지는데요,
처음에는 저도 마찬가지였답니다.
막막한 여러분을 위해,
동시에 역시 데이터 시각화에 대한 관심은 있었지만
무엇을 어떻게 해야 할지 1도 모르는 저(^^)를 위한
연재 포스팅을 시작하고자 합니다!
용어도 낯설었던 ‘데이터 시각화’가
현 시대에 꼭 필요한 스킬이라는 사실을 깨닫기까지!
그 여정을 글로 기록하고 공유하는 시간이 되었으면 합니다:)
우선, 데이터 시각화란 말 그대로
“데이터 분석 결과를 쉽게 이해할 수 있도록
시각적으로 표현하고 전달하는 과정”
을 말하는데요,
‘빅데이터’라는 단어가 HOT 키워드로 떠오르며
점점 방대한 양의 데이터를 다룰 수 있는 능력이
필수템이 되어가는 요즘!
왜 데이터 시각화가 필요하냐 물으신다면?
흠… 예를 한번 들어 볼까요?
사실 저는 개인적으로 외국인과의 결혼에 대한 로망이 있어요(어머)
그래서 한국에 거주하는 꽃미남 외국인들이 나오는 프로라면
‘비정상회담’부터 ‘내 친구의 집은 어디인가’까지 빼먹지 않고 챙겨보는데요,
문득 이런 궁금증이 들었어요.
‘현재 한국에서 국제결혼은 증가하고 있을까 감소하고 있을까?’
‘내가 살고 있는 부산은 국제결혼이 많이 이루어지는 곳일까?’
‘외국인남자 + 한국인여자의 결혼 비율이 높을까,
아니면 외국인여자 + 한국인남자의 결혼 비율이 높을까?’
‘그래서! 내가 외국인 남자와 결혼하려면 도대체 어디로 가야 확률이 높은 것일까??’
이와 같은 궁금증을 해소하고자 방법을 찾아나선 부산 소녀!
몇 가지 방법을 생각해냈어요. 우선,
1. 네이버에 물어본다
내가 알고 싶은 정보가 없다는 사실보다,
과연 저 수많은 글 중 내가 신뢰할만한 자료가 있을지가 더 의문…
2. 기관에 전화해서 물어본다
역시 ‘국제 결혼 안내 프로그램 신청’에 대해서만
상세히 안내해주실 뿐…
역시 원하는 정보를 얻을 수가 없다…
3. 데이터를 활용한다
“역시, 데이터가 가장 빠르고 효과적이군!
거기다 신뢰할만한 자료이니 좋아 좋아.
통계청, 서울시를 비롯해
공공데이터가 많이 개방된 요즘 시대에,
데이터 찾기는 어렵지 않지^^”
(10분 뒤)
드디어 찾게 된 ‘국제결혼’ 자료!! 그런데…
…응?!
ㅠㅠ문제는 이걸 통해 과연 무엇을 알 수 있는 걸까요…
데이터에 대한 접근성이 아무리 높아졌다 해도
이를 활용하지 못하면 말짱 도로묵이라는거….
위의 엑셀 수치들은 나의 궁금증에 대한
해답이 결코 될 수 없다는 절망적인 사실….
중요한 것은 데이터 그 자체가 아니라
데이터를 어떻게 사람들에게 이해시키느냐! 라는 것.
바로 이 때 필요한 것이 ‘데이터 시각화’입니다!!
그렇다면 데이터 시각화의 예시를 한번 살펴볼까요?
1. The Best and Worst Places to Grow Up: How Your Area Compares
(출처 : 뉴욕타임즈, http://www.nytimes.com/interactive/2015/05/03/upshot/the-best-and-worst-places-to-grow-up-how-your-area-compares.html?abt=0002&abg=0&_r=0)
우선, 빈곤가정의 양육비를 지역별로 비교한 데이터 시각화 자료입니다!
차트를 함께 보시죠.
뉴욕(New York)의 경우, 전 세계 빈곤가정 평균 대비
양육비를 2,830달러 절약할 수 있다는 것을 확인할 수 있습니다.
이에 비해 뉴욕 옆에 위치한 베르겐(Bergen)은
동일 기준 대비 양육비가 3,690달러가 더 드는군요.
이처럼 지도 위에 색상의 구분을 통해 데이터를 표현한 방식도 효과적이네요!
2. Ebola spreads slower, kills more than other diseases
(출처 : 워싱턴포스트, http://www.washingtonpost.com/wp-srv/special/health/how-ebola-spreads/)
다음은 에볼라를 비롯한 각종 전염병의 치사율과 감염속도 등을 비교한 시각화 자료입니다.
에볼라, 천연두, 홍역 등에 감염된 사람수, 사망자 수를
경과일에 따라 모자이크 방식으로 변하는 양상을 확인할 수 있습니다.
이와 같은 차트를 ‘인터랙티브 차트(interactive chart)’라고 합니다!
본문을 보면 확인하실 수 있는데요, 상단 바를 Day1에서 Day78까지 조정하면
그에 따라 결과 값이 각기 다른 이미지로 나타나는 것을 볼 수 있습니다!
질병에 관한 다양한 자료를 한 눈에 볼 수 있는 유용한 시각화 방식이네요.
3. Among the Oscar Contenders, a Host of Connections
(출처 : 뉴욕타임즈, http://www.nytimes.com/interactive/2013/02/20/movies/among-the-oscar-contenders-a-host-of-connections.html?_r=0)
마지막으로 아카데미 수상자들의 네트워크를 분석한 자료입니다!
배우, 제작자, 감독들 간에 서로 어떻게 알게 되었고,
어떤 친분 관계를 갖고 있는지 등을
인물 사진을 직접 활용하여 한 눈에 볼 수 있도록 시각화하였는데요,
데이터가 꼭 수치일 필요는 없겠죠?
사람들 간의 네트워크까지도 하나의 데이터로서
시각화가 가능하다는 것을 보여주는 좋은 사례네요^^
다양한 사례를 통해
데이터 시각화가 무엇인지, 감이 오셨나요?^^
결국,
스윽- 한 눈에 보아도
어떤 내용을 내포하고 있는 데이터인지 알 수 있도록 하고 싶다면
시각적인 작업이 필수! 라는 사실을 깨달은 부산소녀!
그렇다면 이와 같이 시각화된 결과물은
어떤 과정을 거쳐야 만들 수 있는 걸까요?
어떤 방법을 사용할지 이리저리 찾던 중
이미 다양한 종류의 ‘데이터 시각화 툴’ 이 있다는 사실을 발견하게 되는데…!
다음 화에서는 쉽고 유용한 여러 가지 데이터 시각화 툴을 소개해드리고,
또 실제 사용해본 후기를 들려드릴게요!^^
(To be continued)
데이터 시각화 전문 기업, 뉴스젤리 http://newsjel.ly/
빅데이터 분석을 기반으로 데이터 시각화를 통해 말랑말랑한 아이디어로
세상을 보는 데이터 스토리텔링 콘텐츠
페이스북 주소 : www.facebook.com/newsjelly