안녕하세요. 데이터 시각화 전문 기업 뉴스젤리입니다.
뉴스젤리에서 네이버 포스트에 ‘데이터랩’ 을 활용한 컨텐츠들을 연재중인 것, 알고 계셨나요?
앞으로 NAVER 데이터랩 활용기 Making Story가 1주일에 1번씩
데이터 시각화 꿀TIP과 함께 여러분들을 찾아올 예정입니다!
첫 번째 에피소드! 이제 시작할게요:)
‘대학생’과 연관된 단어들이 대체 언제부터 힘들고, 부정적인 단어로 가득 차게 되었을까요?
” 우리 때는 말이야…”, “요즘 애들은 말이야…”
그 “요즘” 대학생들은 지금 너무나도 힘들어 하고 있습니다.
그래서! 정말로 비교해 보기로 했습니다!
“요즘” 대학생과 “예전” 대학생은 대체 무엇이, 어떻게 차이가 날까요?
그렇게 NAVER 데이터랩의 첫 번째 에피소드,”데이터로 보는 07학번과 15학번”이 만들어 지게 되었습니다.
[NAVER 데이터랩]
: 다양한 데이터에 사용자의 데이터들을 더해 새로운 데이터들을 생성할 수 있으며, 데이터 기반으로 사업 아이디어를 발굴할 수 있는 서비스 – 출처: 네이버 검색
NAVER 데이터랩은 빅 데이터에 관심이 있는 모든 사람들이 ‘무료’로 ‘쉽게’ 이용할 수 있는 서비스 라는점!
그렇다면 이를 활용해서 어떻게 대학생의 과거와 현재를 시각화 차트로 만들었는지 한번 알아봐야겠죠?
Making Story에서는 꿀TIP 위주로 알려드리니 어서 따라오세요!
첫번째 꿀TIP! 바로 데이터를 잘 나타낼 수 있는 키워드를 선정하는 것입니다!
먼저 대학생에 관한 수많은 데이터들을 큰 가지로 분류하기로 했습니다.
어떻게 분류할지 고민하다 대학생의 일상을 한번 생각해 보았습니다. 자연스럽게 큰 카테고리가 만들어졌고,
그 안에 작은 키워드들을 묶을 수 있게 되었네요^^
어떠한 분류로 데이터를 보여줄지 결정 되었다면 데이터를 보여주기 위한 기준을 정해야죠!
본 콘텐츠에선 ‘과거’와’현재’의 기준을 잡는 것으로 볼 수 있겠네요.
처음에 저는 10년 정도의 기간을 두고 비교하고 싶었기 때문에 네이버 검색량 데이터가 시작되는 2007년과 2016년으로 정했습니다.
하지만.. 데이터를 수집하다 보니, 2016년의 데이터는 업데이트 된 항목이 많지 않더라구요!
그래서 최종적으로 기간을 2007년과 2015년으로 조정하게 되었답니다^^
하지만.. 워낙 많은 기관에서 조사를 진행하다 보니 같은 내용이라도 수치가 다르게 나오는 경우가 있습니다! 그럴땐..
첫째. 조금 더 공신력 있는 기관의 데이터를 선택한다.
둘째. 활용도가 더 많은 데이터를 선택한다.
너무 당연한 말 같지만, 막상 이런 상황을 마주했을 때 당황하시는 분들이 의외로 많은데요~! 꼭 명심하세요!
하지만 무조건적으로 공신력 있는 기관의 데이터를 선택해야만 하는 것은 아니에요.
얼마나 최신화 된 데이터인지, 시계열 정보의 기간이 얼마나 긴지,
조사항목에 대한 세부정보를 포함하고 있는지를 반드시 따져본 후 선택하시는게 최고의 방법입니다!
데이터를 다 준비했다면, 이제 시각화 시키는 부분만 남았네요^^
너무 많은 연도, 어마어마하게 큰 데이터값들..
한눈에 보기쉽게 시각화 하기에는 값들이 너무 크고 많았습니다.
그래서 뉴스젤리에서는 대학생의 ‘과거’ 와 ‘현재’를 조금 더 극명하게 보여주기 위해서,
과감하게 중간값을 생략하기로 했답니다.
중간값은 생략하였으나, 그래도 아직 많은 카테고리들이 남아있죠? 그 중 하나를 잠깐 보겠습니다.
위 사진에 있는 ‘재학’ 이라는 카테고리에는 등록금, 신용불량자 수, 검색량 이라는 데이터가 포함되어 있네요.
등록금의 단위는 ‘원’ 신용불량자 수는 ‘명’, 검색량은 ‘건’ 입니다.
그렇게 되면 각 데이터마다 단위 축을 별개로 만들어야 하는데요, 결국 복잡한 시각화 차트가 되어버리겠죠?
그래서 꿀TIP 다섯번째는 바로! 단위 통일에 관한 내용이 되겠습니다^^
07학번과 15학번은 무엇이 다를까
↓
07학번에 비해 15학번은 무엇이 다를까
빈칸
혹시 눈치 채셨나요?? 두 연도를 비교하는 차트이기 때문에, 꼭 절대값을 보여줄 필요가 없다는 것!!
그렇기 때문에 2007년을 0%로 설정하여 절대값 대신 증가/감소량으로 표현하기로 했습니다.
더불어 한결 보기 편해진 차트를 더욱 강조하기 위해서 증가 값에 따라 선의 길이와 원의 크기를 달리하여 조금 더 한눈에 들어오도록 만들었습니다.
짠! 이제 완성된 시각화 차트를 한번 감상해보시죠!
[출처: http://naver.me/f6u6qkns]
[출처: http://naver.me/f6u6qkns]
배너를 클릭하시면 시각화와 분석을 한눈에 볼 수 있는
뉴스젤리의 칼럼을 보실 수 있습니다^0^
배너를 클릭하시면 더 많은 시각화 꿀TIP을 보실 수 있습니다^0^
데이터 활용에 가치를 더합니다.
누구나 즐길 수 있는, 데이터 시각화 솔루션 “데이지(DAISY)”
데이지 문의 : daisy@newsjel.ly
소개영상 : https://youtu.be/FfuCPJmVHFA
브로셔 다운로드 : https://goo.gl/laV5