#16 데이터 저널리즘 해외기사 – 미래에는 로봇이 당신에 관한 기사를 쓸 것이다

On 3월 10, 2015

#16 데이터 저널리즘 해외기사 – 미래에는 로봇이 당신에 관한 기사를 쓸 것이다

안녕하세요 뉴스젤리입니다.

데이터 저널리즘과 관련된 이번 해외 기사는 Automated Insights의 ‘워드스미스’에 관한 기사입니다.

 

<WIRED>

KLINT FINLEY

2015년 3월 6일자 기사

 

미래에는 로봇이 당신에 관한 기사를 쓸 것이다

 

뿌

이미지 출처 : TECHRADAR

여기 로봇 리포터가 왔다. 이번 주 AP는 전에 다룬 적이 없었던 대학 스포츠에 관한 기사를 자동적으로 생성해주는 소프트웨어를 사용할 것이라고 발표했다. 구체적으로 말하면, 컨텐츠 생성 도구인 노스캐롤라이나의 더럼에 있는 회사인 Automated Insights에 의하여 만들어진 ‘워드스미스’이다

이것은 큰 언론사가 컨텐츠를 만들기위해 알고리즘을 사용하는 가장 최근의 경우이다. Automated Insights의 투자자인 AP는 이미 기업 분기 이익 보고서에 관한 기사를 쓰기 위하여 워드스미스를 사용한다. 한편, 자동화 컨텐츠 경쟁자인 Narrative Science는 포츈지나 Big Ten Network의 출판을 위해 비슷한 서비스를 제공한다. 그리고, 로스앤젤레스 타임즈의 저널리스트는 지난해 지진이 로스앤젤레스에서 발생했을 때 바로 그에 대한 기사를 작성하기 위하여 주문형 소프트웨어를 사용했다. 그러나, 실제로 기계가 생성한 컨텐츠를 누군가가 읽고 있는가? Automated Insights의 CEO인 Robbie Allen은 이것은 적합한 질문이 아니라고 이야기했다. 회사가 10억개의 컨텐츠를 2014년 한 해 동안 만들었음에도 불구하고, 이 장황함은 대중들 위한 것이 아니었다. 오히려, 워드스미스는 한 명의 독자를 가진 보고서를 만들기 위한많은 양의 데이터들을 걸러내는 개인 데이터 과학자의 역할을 했다.

예를들면, 이 회사는 판타지 축구 게임 시즌 중 수만의 야후 이용자들을 위하여 판타지 축구게임의 요약을 만들었다. 그리고, 이것은 헷갈리는 스프레드 시트를 짧고, 사람들이 읽을 수 있는 보고서로 바꾸는 데 많은 도움을 주었다.

언젠가 당신은 당신의 피트니스 관련 데이터나 개인 금융에 대한 이야기를 매일매일 모으는 당신만의 개인 로봇 저널리스트를 가질 수 있을지도 모른다.

“우리는 우리의 머릿속에 있는 전통적인 컨텐츠 창조 모델을 바꿨습니다.” 그가 말했다. “1만의 페이지 뷰를 가진 하나의 스토리 대신, 우리는 1의 페이지 뷰를 가진 1만 개의 스토리를 가지게 될 것입니다.”

 

잉

이미지 출처 : conductor

Building Wordsmith 워드스미스의 개발

워드스미스는 기초적으로 두가지 일을 한다. 첫째로, 이것은 어느 특정게임에서 어떤 선수가 기대했던것만큼 잘 해내지 못하는 것과 같은 재미있는 요점을 찾아내기 위하여 한 뭉치의 구조화된 데이터와 분석을 삼킨다. 그리고 나서, 이것은 이러한 인사이트를 사람들이 읽을 수 있는 문서로 엮어서 만든다. Mad Libs(재미있는 이야기 만들기)의 아주 복잡한 형태라고 생각하면 된다.

Allen은 그가 Cisco에서 엔지리어로 일할 무렵인 8년 전에 이 아이디어를 떠올렸다. 10권의 책을 쓴Allen은 뭔가 새로운 것을 만들기를 원했다. 그래서, 그는 그의 컴퓨터 공학, 글쓰기, 스포츠 분석에 관한 열정은 결합하여 StatSheet라는 회사에 쏟기로 결정했다.

“많은 수의 작가를 고용하는 것은 저에게 매력적이지 않았습니다” 그가 말했다. “스포츠에 대하여 흥미로운 것은 당신이 하는 90퍼센트가 숫자에 대해 쓰는 것이라는 점입니다.”

그러나 곧, Allen은 그 아이디어가 스포츠 뿐만 아니라 어떠한 양적인 데이터에도 적용될 수 없다는 것을 알게 되었다. 그래서, 회사는 그 기술을 금융, 건강관리, 저널리즘 등 다양한 분야의 산업으로 가져오기 위하여 이름을 Automated Insights로 바꿨다.

 

No Brainer 너무나도 쉬운 결정

오늘날 워드스미스는 오로지 잘 구성되어있는 스프레드시트와 데이터베이스와 같은 구조화 된 양적 데이터를 가지고만 이용할 수 있다. Allen은 다른 회사가 자동화 연구, 긴 글 요약, 보도 자료 재작성, 인사이트 도출을 위한 비구조화된 자료 감별 등에 대한 더 발전된 소프트웨어를 만들 수 있을 것이라고 말했다.

그러나 그는 Automated Instights가 예측가능한 미래에 양적인 연구의 뿌리에서 빗나가게 될 것이라는 점에 대하여 의혹을 품었다.

지난 달, 회사는 스포츠 데이터 회사인 STATS와 비즈니스 인텔리전스 회사인 TIBCO를 소유하고 있는 사모회사인 Vista Equity Partners에 의해 인수되었다. Vista의 다른 회사들과의 협력을 통하여, Automated Insights는 더 바빠질 것이라고 Allen은 말했다. “이것은 우리에겐 너무 쉬운 일입니다”그는 말했다. “우리는 우리 앞에 구조화된 데이터에 대하여 너무나도 많은 기회를 가지고 있습니다.  왜 사람들이 몇 년 동안 싸워온 공간을 차지해야 하는거죠?”

그 동안에, 매우 특정한 관객인 당신을 위해 쓰여진 더 많은 이야기를 보는 것을 기대하라.

 

빅데이터, 공공데이터, 소셜데이터로 말랑한 뉴스를 전달하는 뉴스젤리

http://newsjel.ly

  • By 뉴스젤리  0 Comments   
  • 데이터, 데이터스토리텔링, 데이터저널리즘, 로봇, 미래, 시각화, 워드스미스, 저널리즘

    0 Comments

    Leave a Reply

    이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.

    8 − six =