빅데이터 그리고 인포그래픽, 데이터 저널리즘의 국내외 사례

On 8월 31, 2014

빅데이터 그리고 인포그래픽, 데이터 저널리즘의 국내외 사례

다양한 데이터를 활용해 놓치기 쉬운 사실을 독자들에게 쉽게 알려주며, 새로운 인사이트를 파악할 수 있는 기사가 있다. 바로 데이터 저널리즘이다. 빅데이터와 저널리즘의 만남이라고 할 수 있는 데이터 저널리즘이 왜 생겨났고, 이를 활용한 성공적인 국내외 사례에는 어떤 것들이 있는지 이번 컬럼을 통해 알아본다.

——————————————————————————-

연재순서

1회 | 2013. 12 | 데이터 저널리즘이란

2회  2014. 1 | 데이터 저널리즘의 국내외 사례

3회 | 2014. 2 | 데이터 저널리즘의 사용 기술과 인포그래픽

4회 | 2014. 3 | 데이터 저널리즘의 비즈니스 모델

——————————————————————————-

콘텐츠 부재로 인한 무분별한 중복 기사, 인터넷 커뮤니티보다 신속성 및 확산성이 떨어지는 언론, 수익성 악화를 해결하기 위한 선정적인 광고. 이런 사실들이 현재 저널리즘이 겪고 있는 문제점들이다. 이 시점에 저널리즘이 빅데이터라는 새로운 분야와 만나 변화를 시도하고 있다. 이것이 바로 데이터 저널리즘이다. 특히 상당한 양의 데이터가 생겨나고 있는 현재, 데이터 분석으로 쉽게 알아내기 힘든 사실들을 파악해 인포그래픽이라는 데이터 시각화 툴로 정보를 받아들이는 이들의 이해를 돕는 다는 것이 데이터 저널리즘의 장점으로 꼽힌다.

– 4개 주요 소셜 미디어를 통해 매일 5억장 이상의 사진이 공유되고, 매 분마다 100시간 이상 분량의 영상이 유튜브에 업로드 되고 있다(KPCB).

– 올 한 해 생성되는 디지털 정보량은 약 1.8제타바이트(1조8,000억 기가바이트)가 될 전망이고 정보량은 2년마다 2배씩 증가해 오는 2020년이면 현재의 50배까지 증가할 것으로 예측된다(IDC : International Data Corporation).

데이터 저널리즘은 소셜 미디어를 통한 빅데이터 뿐만 아니라, 정부 및 빅데이터를 지원하는 유관기관이 공개하는 공공데이터를 통해서도 많은 효과를 보고 있다. 특히 영국 정부는 2004년 영국 중앙정부 오픈데이터 플랫폼인 CKAN을 구축하고 정부예산에 관한 통계자료 시각화 서비스인 Open Spending 서비스를 제공하는 등 전폭적인 공공데이터 개발에 힘썼으며, 그 결과 현재 데이터 저널리즘은 영국의 가디언지와 BBC 등이 이끌고 있다. 물론 국내에서도 지난 2013년 11월 4일 공공데이터활용지원센터가 설립되며 본격적인 공공데이터 개방에 나섰으며, 언론기관에서는 연합뉴스의 인터랙티브 뉴스와 조선일보의 조선닷컴 인포그래픽스, 그리고 뉴스젤리 등이 적극적으로 데이터 저널리즘에 관한 실험을 하고 있다.

해외 사례 : 가디언 데이터 블로그

데이터 저널리즘을 이끌어가는 최고의 언론이라고 인정받는 영국의 유력 일간지 가디언은 일찍이 데이터 저널리즘 뉴스룸을 설치하고, 데이터 분석을 통해 독자들과 정보를 나누고  있다. 궁극적인 데이터 민주화를 실현하고자, 데이터 블로그(www.datajournalismblog.com/blog)까지 시도했다. 독자 대상만이 아니라, 언론사의 데이터 활용법을 제시하는 등 끊임없는 시도를 통해 데이터의 중요성을 강조했고 2009년 1월에 시작 한 이후로 2,000여 건의 기사를 제공해오고 있다. 2011년에는 출범 2년을 맞이해 그 동안 시도했던 사례들을 모아 엑셀 파일로 공개하기도 했다.

데이터 블로그는 매년 엄청난 양의 정부 예산 데이터를 인포그래픽으로 시각화해 쉬운 이해를 돕고 있다. 특히 가디언은 2011년 8월 영국에서 일어난 폭동 사건에 대해서도 데이터 기반으로 심도 깊게 정리한 <Reading the Riots(영국 폭동에 대한 진실 찾기)> 기사를 선보였는데, 이는 영국 언론의 호평뿐 아니라 제 1회 데이터 저널리즘 어워드(2012 Data Journalism Awards) 데이터 시각화/스토리텔링 부문에서 1위를 차지하기도 했다.

이 사례와 관련해 조금 더 자세히 살펴보면, 데이비드 캐머런 영국 총리는 폭동 사태가 범죄조직에 의한 것이라고 주장했지만 독자들이 주장하는 폭동 사태의 원인은 다양했다. 가디언은 이 시점이 실제 수치와 증거를 활용한 데이터 저널리즘이 나서야 할 때라고 판단했다. 가디언은 폭동에 참여했던 270명을 인터뷰했고, 폭동 사태와 관련된 257만개의 트윗을 분석했다. 또한 폭동 사태와 관련된 사건 리스트를 온라인 홈페이지에 올린 후, 독자들이 직접 참여해 함께 데이터를 작성할 수 있도록 유도했다. 그 후, 사건과 관련 된 루머들을 정리했는데, 수집된 데이터에 기반해 다각도로 데이터를 분석한 후 인포그래픽, 인터랙티브 인포그래픽, 인터랙티브 맵, 인터랙티브 타임라인 등으로 시각화해 최종적으로 관련 내용을 공개했다. 그 결과 ‘경찰과 정부에 대한 불신’이 폭동의 가장 큰 원인으로 도출돼, 정부의 주장과 상반된 결과를 보여줬다. 이처럼 데이터에 기반한 기사를 통해 가디언은 언론의 본 역할을 했다고 평가 받고 있으며, 아직까지도 데이터 저널리즘의 대표 사례로 손꼽히고 있다.

 

image

 

<그림 1> 가디언의 데이터 시각화 프로세스(출처 : datajournalismhandbook.org)

이처럼 데이터에 기반한 기사를 통해 가디언은 언론의 본 역할을 했다고 평가받고 있으며, 아직까지도 데이터 저널리즘의 대표 사례료 손꼽히고 있다.

몇몇 사람들은 정확한 데이터 저널리즘을 위해서는 해커처럼 코드를 작성하고 SQL에 몰두 하는 것이 해답이라고도 한다. 하지만 가디언은 모든 데이터 저널리즘 기사들은 하나의 과정이며, 그들이 하는 대다수의 일은 단지 엑셀을 사용한 것일 뿐이라고 한다. 데이터 저널리즘의 핵심은 철저하게 데이터를 기반으로 의미 있는 분석을 도출해내는 것이지, 뛰어난 기술이 아니라는 것이다.

국내 사례 : 연합뉴스

“한 장의 그래프가 천 마디 이상의 말을 한다”는 말이 있다. 이는 실제적인 수치들로 증명된 사실이다. 국내 언론들이 종종 리서치 기관과의 협력으로 설문결과를 시각화해 보여주고 있는 것처럼 효과적인 인포그래픽이 글로만 구성된 기사보다 더 큰 확산과 효과와 쉬운 이해를 돕는다는 것은 자명한 사실로 보인다. 하지만 데이터 저널리즘은 기존의 기사를 보조하는 몇 장의 이미지가 아니며, 그것을 데이터 저널리즘이라고 할 수는 없다.

최근 연합뉴스의 미디어랩에서는 데이터 저널리즘과 관련된 다양한 실험을 하고 있는데, 이에 따라 국내 언론사에서도 본격적으로 데이터 저널리즘이 주목 받을 것이라는 희망이 생기고 있다. 연합뉴스에서 진행한 데이터 저널리즘의 사례를 보면, 통계청의 시도별 자장면 평균 가격 데이터를 인터랙티브 인포그래픽 맵을 통해 전달한 바 있다. 또한 지역 명, 값, 색상 등을 독자들이 직접 선택할 수 있도록 하고 인포그래픽에 사용된 로우 데이터를 공개해 누구나 볼 수 있게 했다.

 

image

 

<그림 2> 대한민국에서 자장면이 가장 비싼 곳은 어디?(출처 : 연합뉴스)

연합뉴스 데이터 사이트에서는 독자들에게도 인터랙티브 그래프를 만드는 기능을 제공하고 있다. 자신이 쓴 글이나 공공 데이터를 올리면 자동으로 시각화해 그래프를 만들고, 이를 쉽게 자신의 홈페이지 혹은 블로그 등에 공유할 수 있도록 한 기능이다. 이는 데이터 저널리즘이 지향하는 데이터 민주화의 흐름에 적합한 것으로, 누구나 데이터를 분석해 의미를 찾고 시각화할 수 있게 한 것으로 평가된다. 이와 같은 연합뉴스의 시도는 국내 언론 중 데이터 저널리즘을 가장 적극 활용한 사례라고 볼 수 있다.

국내 사례 : 뉴스젤리

국내외 언론사들의 데이터 저널리즘에 관한 관심이 높아지고 있을 때, 스타트업 뉴스젤리(www.newsjel.ly)에서는 새로운 관점의 데이터 저널리즘 관련 서비스를 출시했다. 아직 출시된 지 한달 남짓 된 서비스지만, 빅데이터에 대한 다양한 경험을 갖고 있는 인력들이 모여 데이터에 기반한 다양한 이슈들을 분석하고 새로운 시각으로 스토리를 입혀서 콘텐츠를 보여주고 있다.

 

image

 

<그림 3> 정치와 연예 스캔들의 상관관계 분석(출처 : www.newsjel.ly/issue/5)

뉴스젤리는 공공 데이터, 소셜 미디어 데이터, 리서치 데이터 분석을 기반으로 어려운 사회적 이슈들을 독자들에게 인포그래픽과 다양한 차트로 쉽게 이해시키고자 했으며, 더 나아가 새로운 사실 전달을 통해 차별화된 형태의 언론 서비스를 제공하는 것을 비전으로 삼고 있다.

뉴스젤리에서는 매주 새로운 주제의 인포그래픽, 태그 클라우드, 다양한 차트와 스토리를 이용한 기사를 제공하고 있다. 기사 작성에 사용된 로우 데이터까지 제공하고 있으며, 기사에 대한 찬반 투표와 소셜 댓글 기능을 통해 독자들의 의견을 받아서 완성되는 참여형 언론을 지향하고 있다. 뉴스젤리에서 최근에 다룬 한 기사를 보면, 누구나 한번쯤 궁금했던 정치 이슈와 연예계 스캔들의 상관관계를 기존 언론 기사의 양과 트윗을 통해 분석하는 실험을 선보인 바 있다. 또한 실시간으로 관련 트윗들을 보여주는 방식으로 관련 의견들을 한 곳에 모아볼 수 있게 한 것도 특징이다. 이처럼 하나의 서비스 형태로 데이터 저널리즘을 풀고 있는 뉴스젤리의 향후 행보도 기대된다.

국내외 언론들의 데이터 저널리즘에 관한 시도는 이 뿐만이 아니다. 크라우드 소싱 기반으로 독자들이 데이터 수집에 직접 참여하고, 이를 데이터 분석 단계에 반영하는 방식도 데이터 저널리즘의 한 사례로 등장하고 있으며, 해외에서는 데이터 저널리즘과 크라우드 소싱을 연계해 하나의 개방형 플랫폼으로 구축하려는 실험들도 진행되고 있다. 국내에서는 연합뉴스 이외에도 전자신문 비주얼 IT 인포그래픽스, 조선닷컴 인포그래픽스 등이 그 시도를 이어가고 있지만 아직은 인포그래픽에 집중돼 있는 편이다.

해외에 유명한 데이터 저널리즘 사례가 많고 몇몇 해외 언론사가 두각을 나타내며 앞서가고 있지만, 기본적으로 데이터 저널리즘은 데이터로 말하고 데이터로 증명하는 것이다. 이는 데이터가 가장 중요한 핵심 경쟁력이라 할 수 있는데, 어느 나라보다 데이터를 많이 소비하고 많이 생산하는 국내의 모습은 데이터 저널리즘이 발전하기에 적합한 환경이라고 판단된다. 특히 최근 정부에서 표방하고 있는 ‘정부 3.0’은 정부가 생산하는 대부분의 정보와 서비스를 모든 개인에게 공개하고 이를 활용할 수 있도록 하는 것을 목표로 하고 있기에 향후 데이터 저널리즘 분야의 뛰어난 국내 사례들도 많이 나올 것으로 예상된다.

<출처 : 마이크로소프트웨어>

  • By 뉴스젤리  0 Comments   
  • 뉴스젤리, 데이터스토리텔링, 데이터시각화, 데이터저널리즘

    0 Comments

    Leave a Reply

    이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.

    eighteen − 17 =