[NAVER 데이터랩 활용기 Making Story] Episode 1. 데이터로 보는 07학번과 15학번

On 7월 4, 2016

[NAVER 데이터랩 활용기 Making Story] Episode 1. 데이터로 보는 07학번과 15학번

 

 

 

안녕하세요. 데이터 시각화 전문 기업 뉴스젤리입니다.

뉴스젤리에서 네이버 포스트에 ‘데이터랩’ 을 활용한 컨텐츠들을 연재중인 것, 알고 계셨나요?

 

앞으로 NAVER 데이터랩 활용기 Making Story가 1주일에 1번씩

데이터 시각화 꿀TIP과 함께 여러분들을 찾아올 예정입니다!

첫 번째 에피소드! 이제 시작할게요:)

 

슬라이드2

 

‘대학생’과 연관된 단어들이 대체 언제부터 힘들고, 부정적인 단어로 가득 차게 되었을까요?

슬라이드3

 

” 우리 때는 말이야…”, “요즘 애들은 말이야…”

그 “요즘” 대학생들은 지금 너무나도 힘들어 하고 있습니다.

슬라이드4

그래서! 정말로 비교해 보기로 했습니다!

“요즘” 대학생과 “예전” 대학생은 대체 무엇이, 어떻게 차이가 날까요?

슬라이드5

그렇게 NAVER 데이터랩의 첫 번째 에피소드,”데이터로 보는 07학번과 15학번”이 만들어 지게 되었습니다.

 

[NAVER 데이터랩]

: 다양한 데이터에 사용자의 데이터들을 더해 새로운 데이터들을 생성할 수 있으며, 데이터 기반으로 사업 아이디어를 발굴할 수 있는 서비스 – 출처: 네이버 검색

 

NAVER 데이터랩은 빅 데이터에 관심이 있는 모든 사람들이 ‘무료’로 ‘쉽게’ 이용할 수 있는 서비스 라는점!

그렇다면 이를 활용해서 어떻게 대학생의 과거와 현재를 시각화 차트로 만들었는지 한번 알아봐야겠죠?

Making Story에서는 꿀TIP 위주로 알려드리니 어서 따라오세요!

슬라이드6

 

슬라이드7

첫번째 꿀TIP! 바로 데이터를 잘 나타낼 수 있는 키워드를 선정하는 것입니다!

먼저 대학생에 관한 수많은 데이터들을 큰 가지로 분류하기로 했습니다.

어떻게 분류할지 고민하다 대학생의 일상을 한번 생각해 보았습니다. 자연스럽게 큰 카테고리가 만들어졌고,

그 안에 작은 키워드들을 묶을 수 있게 되었네요^^

슬라이드8

 

어떠한 분류로 데이터를 보여줄지 결정 되었다면 데이터를 보여주기 위한 기준을 정해야죠!

본 콘텐츠에선 ‘과거’와’현재’의 기준을 잡는 것으로 볼 수 있겠네요.

 

처음에 저는 10년 정도의 기간을 두고 비교하고 싶었기 때문에 네이버 검색량 데이터가 시작되는 2007년과 2016년으로 정했습니다.

하지만.. 데이터를 수집하다 보니, 2016년의 데이터는 업데이트 된 항목이 많지 않더라구요!

그래서 최종적으로 기간을 2007년과  2015년으로 조정하게 되었답니다^^

 

슬라이드9

하지만.. 워낙 많은 기관에서 조사를 진행하다 보니 같은 내용이라도 수치가 다르게 나오는 경우가 있습니다! 그럴땐..

첫째.  조금 더 공신력 있는 기관의 데이터를 선택한다.

둘째. 활용도가 더 많은 데이터를 선택한다.

너무 당연한 말 같지만, 막상 이런 상황을 마주했을 때 당황하시는 분들이 의외로 많은데요~! 꼭 명심하세요!

하지만 무조건적으로 공신력 있는 기관의 데이터를 선택해야만 하는 것은 아니에요.

 

얼마나 최신화 된 데이터인지, 시계열 정보의 기간이 얼마나 긴지,

조사항목에 대한 세부정보를 포함하고 있는지를 반드시 따져본 후 선택하시는게 최고의 방법입니다!

슬라이드10

데이터를 다 준비했다면, 이제 시각화 시키는 부분만 남았네요^^

너무 많은 연도, 어마어마하게 큰 데이터값들..

한눈에 보기쉽게 시각화 하기에는 값들이 너무 크고 많았습니다.

 

그래서 뉴스젤리에서는 대학생의 ‘과거’ 와 ‘현재’를 조금 더 극명하게 보여주기 위해서,

과감하게 중간값을 생략하기로 했답니다.

슬라이드11

중간값은 생략하였으나, 그래도 아직 많은 카테고리들이 남아있죠? 그 중 하나를 잠깐 보겠습니다.

위 사진에 있는 ‘재학’ 이라는 카테고리에는 등록금, 신용불량자 수, 검색량 이라는 데이터가 포함되어 있네요.

등록금의 단위는 ‘원’ 신용불량자 수는 ‘명’, 검색량은 ‘건’ 입니다.

그렇게 되면 각 데이터마다 단위 축을 별개로 만들어야 하는데요, 결국 복잡한 시각화 차트가 되어버리겠죠?

그래서 꿀TIP 다섯번째는 바로! 단위 통일에 관한 내용이 되겠습니다^^

 

07학번과 15학번은 무엇이 다를까

07학번에 비해 15학번은 무엇이 다를까

빈칸

혹시 눈치 채셨나요?? 두 연도를 비교하는 차트이기 때문에, 꼭 절대값을 보여줄 필요가 없다는 것!!

그렇기 때문에 2007년을 0%로 설정하여 절대값 대신 증가/감소량으로 표현하기로 했습니다.

더불어 한결 보기 편해진 차트를 더욱 강조하기 위해서 증가 값에 따라 선의 길이와 원의 크기를 달리하여 조금 더 한눈에 들어오도록 만들었습니다.

짠! 이제 완성된 시각화 차트를 한번 감상해보시죠!

 

데이터

[출처: http://naver.me/f6u6qkns]

개인생활

[출처: http://naver.me/f6u6qkns]

슬라이드12

배너를 클릭하시면 시각화와 분석을 한눈에 볼 수 있는

뉴스젤리의 칼럼을 보실 수 있습니다^0^

university student-01

  

배너를 클릭하시면 더 많은 시각화 꿀TIP을 보실 수 있습니다^0^

newsjelly_logoset____________-01

 

 

데이터 활용에 가치를 더합니다.

누구나 즐길 수 있는, 데이터 시각화 솔루션 “데이지(DAISY)”

데이지 문의 : daisy@newsjel.ly

소개영상 : https://youtu.be/FfuCPJmVHFA

브로셔 다운로드 : https://goo.gl/laV50j

  • By 뉴스젤리  0 Comments   
  • Tableau, 검색량, 검색어 통계, 공공 데이터, 공공데이터, 그래프 만들기, 네이버 데이터랩, 대학생 통계, 데이지, 데이터 시각화, 데이터 시각화 솔루션, 데이터 시각화 팁, 데이터 활용, 빅데이터, 시각화 솔루션 데이지, 시각화 차트, 시각화 팁, 인포그래픽

    0 Comments

    Leave a Reply

    이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.

    sixteen − 15 =