On 7월 4, 2016

[NAVER 데이터랩 활용기 Making Story] Episode 1. 데이터로 보는 07학번과 15학번

안녕하세요. 데이터 시각화 전문 기업 뉴스젤리입니다.

뉴스젤리에서 네이버 포스트에 ‘데이터랩’ 을 활용한 컨텐츠들을 연재중인 것, 알고 계셨나요?

앞으로 NAVER 데이터랩 활용기 Making Story가 1주일에 1번씩

데이터 시각화 꿀TIP과 함께 여러분들을 찾아올 예정입니다!

첫 번째 에피소드! 이제 시작할게요:)

슬라이드2

‘대학생’과 연관된 단어들이 대체 언제부터 힘들고, 부정적인 단어로 가득 차게 되었을까요?

슬라이드3

” 우리 때는 말이야…”, “요즘 애들은 말이야…”

그 “요즘” 대학생들은 지금 너무나도 힘들어 하고 있습니다.

슬라이드4

그래서! 정말로 비교해 보기로 했습니다!

“요즘” 대학생과 “예전” 대학생은 대체 무엇이, 어떻게 차이가 날까요?

슬라이드5

그렇게 NAVER 데이터랩의 첫 번째 에피소드,”데이터로 보는 07학번과 15학번”이 만들어 지게 되었습니다.

[NAVER 데이터랩]

: 다양한 데이터에 사용자의 데이터들을 더해 새로운 데이터들을 생성할 수 있으며, 데이터 기반으로 사업 아이디어를 발굴할 수 있는 서비스 – 출처: 네이버 검색

NAVER 데이터랩은 빅 데이터에 관심이 있는 모든 사람들이 ‘무료’로 ‘쉽게’ 이용할 수 있는 서비스 라는점!

그렇다면 이를 활용해서 어떻게 대학생의 과거와 현재를 시각화 차트로 만들었는지 한번 알아봐야겠죠?

Making Story에서는 꿀TIP 위주로 알려드리니 어서 따라오세요!

슬라이드6

슬라이드7

첫번째 꿀TIP! 바로 데이터를 잘 나타낼 수 있는 키워드를 선정하는 것입니다!

먼저 대학생에 관한 수많은 데이터들을 큰 가지로 분류하기로 했습니다.

어떻게 분류할지 고민하다 대학생의 일상을 한번 생각해 보았습니다. 자연스럽게 큰 카테고리가 만들어졌고,

그 안에 작은 키워드들을 묶을 수 있게 되었네요^^

슬라이드8

어떠한 분류로 데이터를 보여줄지 결정 되었다면 데이터를 보여주기 위한 기준을 정해야죠!

본 콘텐츠에선 ‘과거’와’현재’의 기준을 잡는 것으로 볼 수 있겠네요.

처음에 저는 10년 정도의 기간을 두고 비교하고 싶었기 때문에 네이버 검색량 데이터가 시작되는 2007년과 2016년으로 정했습니다.

하지만.. 데이터를 수집하다 보니, 2016년의 데이터는 업데이트 된 항목이 많지 않더라구요!

그래서 최종적으로 기간을 2007년과  2015년으로 조정하게 되었답니다^^

슬라이드9

하지만.. 워낙 많은 기관에서 조사를 진행하다 보니 같은 내용이라도 수치가 다르게 나오는 경우가 있습니다! 그럴땐..

첫째.  조금 더 공신력 있는 기관의 데이터를 선택한다.

둘째. 활용도가 더 많은 데이터를 선택한다.

너무 당연한 말 같지만, 막상 이런 상황을 마주했을 때 당황하시는 분들이 의외로 많은데요~! 꼭 명심하세요!

하지만 무조건적으로 공신력 있는 기관의 데이터를 선택해야만 하는 것은 아니에요.

얼마나 최신화 된 데이터인지, 시계열 정보의 기간이 얼마나 긴지,

조사항목에 대한 세부정보를 포함하고 있는지를 반드시 따져본 후 선택하시는게 최고의 방법입니다!

슬라이드10

데이터를 다 준비했다면, 이제 시각화 시키는 부분만 남았네요^^

너무 많은 연도, 어마어마하게 큰 데이터값들..

한눈에 보기쉽게 시각화 하기에는 값들이 너무 크고 많았습니다.

그래서 뉴스젤리에서는 대학생의 ‘과거’ 와 ‘현재’를 조금 더 극명하게 보여주기 위해서,

과감하게 중간값을 생략하기로 했답니다.

슬라이드11

중간값은 생략하였으나, 그래도 아직 많은 카테고리들이 남아있죠? 그 중 하나를 잠깐 보겠습니다.

위 사진에 있는 ‘재학’ 이라는 카테고리에는 등록금, 신용불량자 수, 검색량 이라는 데이터가 포함되어 있네요.

등록금의 단위는 ‘원’ 신용불량자 수는 ‘명’, 검색량은 ‘건’ 입니다.

그렇게 되면 각 데이터마다 단위 축을 별개로 만들어야 하는데요, 결국 복잡한 시각화 차트가 되어버리겠죠?

그래서 꿀TIP 다섯번째는 바로! 단위 통일에 관한 내용이 되겠습니다^^

07학번과 15학번은 무엇이 다를까

07학번에 비해 15학번은 무엇이 다를까

빈칸

혹시 눈치 채셨나요?? 두 연도를 비교하는 차트이기 때문에, 꼭 절대값을 보여줄 필요가 없다는 것!!

그렇기 때문에 2007년을 0%로 설정하여 절대값 대신 증가/감소량으로 표현하기로 했습니다.

더불어 한결 보기 편해진 차트를 더욱 강조하기 위해서 증가 값에 따라 선의 길이와 원의 크기를 달리하여 조금 더 한눈에 들어오도록 만들었습니다.

짠! 이제 완성된 시각화 차트를 한번 감상해보시죠!

데이터

[출처: http://naver.me/f6u6qkns]

개인생활

[출처: http://naver.me/f6u6qkns]

슬라이드12

배너를 클릭하시면 시각화와 분석을 한눈에 볼 수 있는

뉴스젤리의 칼럼을 보실 수 있습니다^0^

university student-01

  

배너를 클릭하시면 더 많은 시각화 꿀TIP을 보실 수 있습니다^0^

newsjelly_logoset____________-01

데이터 활용에 가치를 더합니다.

누구나 즐길 수 있는, 데이터 시각화 솔루션 “데이지(DAISY)”

데이지 문의 : daisy@newsjel.ly

소개영상 : https://youtu.be/FfuCPJmVHFA

브로셔 다운로드 : https://goo.gl/laV50j

  • By 뉴스젤리  0 Comments   
  • 공공데이터, 빅데이터, 인포그래픽, 데이터 시각화, 데이터 시각화 솔루션, 공공 데이터, 데이지, 시각화 솔루션 데이지, 검색어 통계, 그래프 만들기, 네이버 데이터랩, 대학생 통계, 데이터 시각화 팁, 데이터 활용, 시각화 차트, 시각화 팁, Tableau, 검색량
  • 0 Comments

    Leave a Reply

    이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.

    eighteen − 9 =