안녕하세요 뉴스젤리입니다.
이번기사는 빅데이터에 관련된 해외기사 입니다.
<Forbes>
Joshua Steimle
2015년 3월 25일자 기사
빅데이터에 빠지다 – 정보의 바다에서 인사이트 찾기
거의 10년동안, 기업들과 정부들은 세계의 시민들의 이름, 전화번호 뿐만 아닌 많은 디지털 정보를 수집해왔다. 국제 데이터 협회는 최근 데이터 산업이 평균 26.4%의 성장률을 기록하고 있으며 2018년에는 41.5억 달러에 이를 것이라고 예측했다. 이러한 성장률의 의미는 점점 더 많은 회사와 조직들이 미디어 에이전시에 빅데이터를 요청하며 막대한 돈을 들이고 있다는 의미이며, 또한 빅데이터의 힘을 어떻게 이용하는지 알기 위하여 더 많은 돈을 쓰고 있다. 패서디나에 있는 NASA의 Jet Propulsion Lab의 빅데이터 전문가인 Chris Mattmann은 말했다. “NASA는 현재 거의 엑사바이트에 근접한 수백의 페타바이트를 운용하고 있습니다.” 엑사바이트는 막대한 양의 데이터이다. 이것은 1억 기가바이트이고, 숫자상으로 나타내면 1,000,000,000,000,000,000이다.
큰 회사를 위한 빅 데이터
이처럼 막대한 양의 데이터 묶음은 엄청난 속도로 기존의 데이터베이스 기술이 저장하거나 분석할 수 없을 정도로 급증하고 있다. 그러나 중요한 것은 조직이 빅 데이터로 넘쳐나는 깊은 곳에 집중할 필요가 없다는 것이다.
TNS의 아시아 태평양 CEO인 Chris Riquier는 빅 데이터가 얼마나 시장 조사에 막대한 영향을 끼치는 지에 대하여 언급하였다. “시장 조사에서 중요한 것은 서베이와 여론조사 입니다” 그는 과거에 서베이와 몇 주나 걸렸던 그들의 과정을 묘사했다. 그리고 그것을 묘사하는데 소셜 미디어 데이터, 서치 데이터 및 다양한 종류의 데이터를 사용했다. 우리는 이제 연구가 어떻게 완료되는지에 대하여 다시 생각해 볼 기회를 가지고 있다. 빅 데이터의 결과로 우리의 시장에 대처하는 능력과 결정을 내리는 능력이 급진적으로 변화했다.
오늘날 디지털 세계에서 빅데이터는 산업, 정부, 과학, 공공 보건 등 다양한 분야에서 관련성을 찾아내고 있다. 그러나, 이러한 모든 정보로부터 인사이트를 도출해내는 것은 최근까지도 매우 어려운 일이다. 하버드 매거진이 2014년 펴낸 “왜 빅데이터가 큰 문제인가”라는 제목의 기사에 따르면 데이터 묶음을 연결시키고, 데이터를 시각화하고, 빅 알고리즘을 만들어 내는 진보된 통계적이고 컴퓨터를 이용한 방법이 우리가 모든 데이터들을 다루는 것을 가능하도록 만들어 준 가장 핵심적인 혁신이라고 할 수 있다. 거대한 데이터 묶음을 많이 다루는 물리학자나 천문학자로 부터 힌트를 얻어, 데이터 과학자나 사회 과학자는 빅 데이터로부터 인사이트를 얻기 위해 양적인 것과 질적인 것을 결합하고 있다. 빅 데이터 분석은 하버드 공과대학과 응용과학대학에서 데이터 과학의 석사학위를 제공하는 등 이제 새로운 분야를 개척하고 있다.
그들의 책인 “빅데이터 – 우리가 어떻게 살고, 일하고, 생각하는지를 바꾸는 혁명”에서 Schonberger와 Kenneth Cukier은 회사가 빅데이터 분석에 근거하여 결정을 내리는 방법이 어떻게 변해왔는지에 대해서 이야기 한다. 예를 들면, 구글은 최근 저장되어 있던 서치들을 US 독감 발발을 의학 분야에서의 진보를 대표하는 CDC가 예측하는 것보다 더 빨리 예측하기 위하여 사용했다. 월 스트리트 저널의 최근 기사에 따르면 Canadian Bank는 빅 데이터를 저장하고 정제하여 그들의 자금에 대한 세탁이나 사기를 규명하기 위하여 아파치에 의해 개발된 오픈 소스 소프트웨어인 Hadoop을 사용하고 있다.
평범한 사람을 위한 빅 데이터
빅 데이터는 고귀한 목적을 가지고 있다. 하버드, 나사, 구글과 아파치 등은 진보중인 기술과 세상에 대응하기 위하여 빅 데이터 분석을 훌륭하게 활용하고 있다. 그러나, 이미 언급했던 것처럼 빅 데이터로부터 이익을 얻을 수 있는 사람이 수완 좋은 사람뿐인 것은 아니다. 모든 비즈니스가 사용할 수 있는 빅 데이터 수집과 관리에 관한 몇몇가지의 요소들을 살펴보자.
마케팅에서 빅데이터의 주된 사용 중 하나가 서치 엔진 최적화를 위한 것이다. 사업주들은 다양한 소셜 미디어 데이터를 결합한 구글이나 마이크로소프트의 Bing과 같은 서치 엔진이 제공하는 도구를 인터넷 마케팅 캠페인을 수립하기 위한 유용한 인사이트를 창출해내기 위하여 이용할 수 있다. 서치 엔진 최적화의 교차점과 그의 컨설팅 회사인 Hall Analysis의 빅데이터에 집중하고 있는 Joe Hall은 서치 엔진 최적화를 위한 빅데이터에 접근하기 위해서는 두 가지가 있다고 이야기했다. “첫째는 특정한 비즈니스와 직접적으로 관련이 있는 거대한 데이터 묶음을 이용하는 것이다”라고 그가 말했다. “많은 경우 이것은 많은 데이터를 끌어당기는 브랜드나 기업체와 일하는 것을 의미한다.” Hall은 대략 16만개의 백링크를 가진 고객사의 예시를 언급했다. 이 링크들은 구글이나 다른 서치 엔진에게 있어서 중요한 랭킹 요소이다. “그 수준에 있어서 이것은 백링크 분석을 위한 규칙을 바꾼다” 패턴 분석과 같은 업무를 수행하는데 필요한 튼튼한 공정력을 위해 필요한 데이터 묶음의 사이즈에 대하여 설명하며 Hall이 말했다. 그가 언급한 두번째 방법은 더 정교한 상황 인식을 개발하는 것이다. 이것은 랭킹 요소들을 더 잘 이해하기 위하여 상관관계 연구를 진행하는 것이나 혹은 랭킹 결과 페이지 내의 광고연결률과 같은 이용자 행태 분석 의미한다. 이 두 종류의 분석은 SEO 전문가로 하여금 더 큰 그림을 만들 수 있도록 도와준다. 그리고 두 방법 모두 거대한 데이터 분석을 필요로 한다. 만약 당신이 빅데이터가 당신의 온라인 마케팅 노력과 상관이 있다고 생각한다면 이것을 당신의 질문 목록에 추가해야 할 것이다.
빅데이터가 비즈니스에서 사용될 수 있는 다른 방법은 고객의 로열티를 얻기 위해서이다. 내가 스타트업의 설립자라고 가정해보자, 그리고 1년이 지난 후 나는 내 스스로 번 돈으로 멋진 휴가를 떠났다. 공항에서 항공사 직원이 나의 짐이 책으로 가득 차서 규정 무게를 초과하여 추가요금을 지불해야 한다는 사실을 알려주었다. 항공사 직원이 모르고 있는 것은 성공적인 스타트업의 CEO로 나는 물론 나의 직원들도 비행기에서 많은 시간을 보내게 될 것이라는 점이다. 만약에 항공사가 신용카드 회사, 소셜 미디어, 블로그, 호텔 등의 소스를 통해 빅데이터를 이용했다면 그들은 아마 무거운 짐가방에 대한 약간의 요금을 포기하는 대신에 훌륭한 고객의 로열티를 얻을 수 있었을 것이다.
만약 당신이 어느 기업에 중역이든, 암을 연구하는 의사이든, 혹은 온라인 스토어의 주인이든 간에 빅데이터는 당신에게 핵심적인 차별점을 만들어 줄 수 있다. 우리는 이제 빅 데이터를 통하여 엄청난 인사이트를 얻어 이용할 수 있다. 우리가 데이터에 기반한 의사결정의 힘을 얻게 됨에 따라, 우리는 우리가 세계에 대해서 생각하는 방식을 바꾸는 것이 불가피한 한계가 없는 연관의 시대로 가게 될 것이다. 오늘날의 아이들은 디지털 시대에 태어난다. 내일의 아이들은 빅데이터의 시대에 태어나게 될 것이다.
빅데이터, 공공데이터, 소셜데이터로 말랑한 뉴스를 전달하는 뉴스젤리