뉴스젤리 리포트
공공데이터로 돈을 버는 시대
정부 3.0 중점 추진과제 중 하나인 공공정보 개방 정책에 따라 우리는 공공데이터를 통해 공공정보를 쉽게 확인하고 활용할 수 있게 되었습니다. 행정안전부가 발표한 ‘2017 행정자치통계연보’에 따르면 2016년말 기준 공공데이터 개방건수는 약 2만 건으로 공공데이터 사업을 시작한 2013년에 비해 4배 가량 증가했고, 그 중 이용자가 자유롭게 데이터를 가공하고 활용할 수 있는 오픈 API 데이터 비중은 약 70%로 절반 이상을 차지했습니다. 정부는 계속해서 데이터를 추가적으로 개방하고 시민들의 데이터 활용을 권장하며 공공데이터로부터 더 많은 혜택을 이끌어내고 있습니다.
사람들은 대개 공공데이터의 혜택으로 열린 정부, 시민들의 참여 증대와 같은 사회적 이익을 많이 떠올립니다. 하지만 공공데이터는 사용하는 사람의 목적과 방법에 따라 엄청난 경제적 이익를 불러오기도 합니다. 실로 공공데이터로 돈을 버는 시대가 도래한 것입니다. 특히 경제적으로 어려운 현시기에 공공데이터의 경제적 가치는 사회 구성원들이 주목해야할 부분입니다.
공공데이터가 가지는 경제적 가치는 크게 정부 부문과 민간 부문으로 나뉩니다. 먼저 정부의 경우 세수 증대에 따른 수익 창출을 얻게 됩니다. 공공데이터를 통해 새롭게 생겨나는 기업들이 증가하는 만큼 정부의 세수도 증가하게 되는 것이죠. 또한 데이터를 기반으로 한 새로운 비즈니스 창출의 기회가 늘어남에 따라 최근 가장 큰 사회문제이기도 한 일자리 부족 문제도 일부 해결할 수 있게 됩니다. 그 외에도 공공기관들 간에 데이터를 주고 받는 거래 비용이 감소하고 링크드 데이터(Linked Data)를 통한 서비스 효율성이 향상하는 등 공공데이터를 통해 여러 간접적 이익을 얻을 수 있습니다.
민간 부문에는 어떤 경제적 혜택이 있을까요? 가장 먼저 공공데이터를 활용하여 새로운 비즈니스 기회를 창출할 수 있습니다. 우리가 자주 사용하는 모바일 앱인 화장품 성분 분석 어플과 버스도착시간 안내 어플도 공공데이터를 기반으로 개발된 새로운 비즈니스 사례 중 하나입니다. 또한 공공데이터는 통일된 형식의 원자료(raw data)를 공개함으로써 원자료 변환에 소요되는 비용을 절감시켜주고, 정확한 정보를 제공함으로써 시민들의 의사 결정에 도움을 줍니다. 즉 낮은 투자 대비 높은 효율을 달성할 수 있게 된 것입니다. 마지막으로 공공데이터는 미래 유망 업종인 데이터와 관련된 IT 인력을 확대하는 역할을 수행합니다. 누구나 사용할 수 있는 데이터가 대량으로 개방됨으로써 개인 혹은 민간기업이 활용할 수 있는 데이터의 양이 증가하고, 그에 따라 관련 인력과 기술이 발전할 수 있는 원동력이 되기 때문입니다.
경제적 파급효과가 높은 공공데이터 분야에 대하여
그렇다면 공공데이터의 경제적 가치는 어떻게 측정할 수 있을까요? 높은 경제적 효과가 있는 데이터가 따로 존재하는 것은 아닐까요? 이를 위해 시각화 솔루션 전문기업 뉴스젤리는 <데이터산업의 경제적 파급효과 분석, 한국혁신학회지(2017)>에서 경제적 파급효과가 높은 ‘산업 부문’을 먼저 살펴본 후, 이를 <공공데이터 민간 개방의 경제적 파급효과 분석 연구, 한국정보화진흥원(2012)>에서 발표한 산업별 공공데이터 유사도 매칭 등의 결과를 적용하여 경제적 파급효과가 높은 ‘공공데이터 분야’를 산출해보았습니다.
다만 뉴스젤리는 두 연구의 시간적 격차를 해소하고 간소화된 공공데이터 분류 개수를 적용하기 위해 분류 기준에 변화가 있었던 항목들에 대해서 ‘비주거용 건물 임대’를 ‘부동산임대 및 공급’으로, ‘건축, 토목 관련 서비스’를 ‘건축공학관련서비스’로, ‘과학’ 분야를 ‘과학기술’ 분야로 매칭하는 등 기존 항목과 가장 유사한 내용을 담고 있는 항목을 매칭하여 조사를 진행했습니다.
**매칭 결과 자세히 보기**
먼저 경제적 가치가 높은 산업군을 알아보기 위해, <데이터산업의 경제적 파급효과 분석, 한국혁신학회지(2017)>에서는 산업연관표 기본부문 중 데이터산업 관련 부문을 관심대상 변수로 두어 분석하는 외생화 작업을 진행했습니다. 이어서 데이터산업이 국내 경제에 미치는 파급효과를 산출하기 위해 산업연관분석을 적용하여 생산유발효과, 부가가치 유발효과, 취업유발효과를 각각 도출했습니다.
각 지수에 대해 설명하자면 생산유발효과란 데이터 산업에서의 1원 생산 증가 시 타산업에서의 생산이 얼마나 증가하는지를 의미합니다. 데이터 산업에 대한 투자는 결국 타 산업의 생산증대에도 유기적으로 연결되어있으므로, 타산업의 총 투자 및 총 산출로 인한 경제적 파급효과 도출이 가능합니다. 다음으로 부가가치 유발 효과는 데이터 산업에서의 1원 생산 증가 시 타 산업에서의 부가가치가 얼마나 증가하는지를 뜻합니다. 마지막으로 취업유발 효과는 데이터 산업에서의 10억 원 생산 증가 시 타산업에서의 취업자가 얼마나 증가하는 지를 의미합니다. 따라서 세 지수 모두 값이 클수록 국내 경제에 미치는 경제적 파급효과가 큰 것으로 해석할 수 있습니다.
연구 결과 경제적 파급효과가 높은 데이터 산업은 사업지원서비스와 전문·과학 및 기술서비스 분야였습니다. 사업지원서비스는 ‘청소소독 및 시설유지’, ‘인력공급 및 알선’, ‘기타 사업지원서비스’ 등을 포괄하는 산업 분야로 생산유발효과, 부가가치 유발효과, 취업유발효과에서 1위를 차지했습니다. 전문·과학 및 기술서비스는 세 지수에서 모두 3위를 차지하며 전반적으로 높은 순위에 위치했습니다. 반면 전기 및 전자기기, 부동산 및 임대, 도소매서비스의 경우 생산유발효과, 부가가치 유발효과, 취업유발효과에서 각각 2위를 차지하며 각 지수별 파급효과가 높은 데이터 분야로 평가되었습니다.
이어서 위의 산업과 관련하여 경제적 파급효과가 높은 공공데이터 분야를 선별하기 위해 <공공데이터 민간 개방의 경제적 파급효과 분석 연구, 한국정보화진흥원(2012)>에서 진행한 공공데이터 33개 분야와 산업연관표 기본산업부문의 유사도를 매칭하였습니다. 여기서 유사도란 각 기본산업부문이 공공데이터 각 분야와의 일치하는 정도를 0과 1사이의 수로 표현한 값입니다. 해당 연구에서는 최소유사성 수치인 0.5이상의 값에 대해서만 산업연관표의 기본산업부문이 공공데이터 분야와 매칭이 된 것으로 간주했습니다. 그 결과 전기 및 전자기기와 도소매서비스 산업은 매칭되는 공공데이터가 존재하지 않았으며 사업지원서비스는 고용·노동분야, 전문·과학 및 기술서비스는 과학과 법률 분야, 부동산 및 임대는 국토관리 분야에서 최소유사성 수치 이상의 유사도를 가지고 있었습니다.
추가적으로 매칭된 공공데이터 분야 33개 분야를 현재 공공데이터 포털에서 명시하고 있는 공공데이터 16개 분야로 재분류하였습니다. 그에 따라 고용·노동 분야는 산업고용, 과학 분야는 과학기술 분야로 재정의되었습니다.
자치행정기관별 경제적 파급효과가 높은 공공데이터 인기 순위
그렇다면 자치행정기관들은 경제적 파급효과가 높은 데이터들을 잘 개방하고 있을까요? 뉴스젤리는 앞서 나온 조사결과를 토대로 경제적 파급효과가 높다고 판단되는 산업고용, 과학기술, 법률, 국토관리 분야에서 자치행정기관이 개방하고 있는 데이터들의 조회수를 살펴보았습니다. 조회수가 높은 데이터들을 살펴봄으로써 각 자치행정기관이 경제적인 목적으로 활용하고자 하는, 이른바 ‘쓸 만한’ 데이터들을 얼마나 많이 개방하고 있는지 알아볼 수 있었습니다.
여기서 공공데이터 개방건수 대신 조회수를 평가 기준으로 삼은 이유는 크게 두 가지입니다. 먼저 공공데이터의 개방건수는 자치행정기관마다 혹은 공공데이터를 관리하는 담당자마다 달라질 수 있습니다. 같은 내용이라도 공공데이터를 어떻게 분류하느냐에 따라 1개 혹은 2개 이상으로도 나뉘어질 수 있기 때문에 수치가 과장될 우려가 있습니다. 두번째로 공공데이터가 경제적 가치를 가지기 위해서는 데이터 개방 단계를 넘어 데이터 재사용 수준까지 이르러야하기 때문입니다. 공공데이터의 조회수는 시민들의 해당 데이터에 대한 관심과 재사용에 대한 가능성을 내포하고 있습니다. 따라서 민간 부문의 경제 파급효과를 설명하는 데 유용한 평가 기준이 됩니다.
먼저 자치행정기관들이 개방한 산업고용, 과학기술, 국토관리 분야 데이터들 중 조회수 최대값을 살펴보겠습니다. 자치행정기관에서 발표한 공공데이터가 없는 법률 분야는 제외되었습니다. 산업고용 분야에서는 대구광역시, 서울특별시, 전라남도가 조회수 최대값이 가장 높았고 과학기술 분야에서는 인천광역시, 대구광역시, 강원도의 데이터가 가장 높았습니다. 또한 국토관리 분야에서는 세종특별자치시가 눈에 띄게 진한 색으로 표시되어 조회수 최대값이 높은 지역임을 한눈에 확인할 수 있었습니다.
경제적 파급효과가 가장 높은 산업고용 분야에서 조회수 1위를 차지한 데이터는 ‘대구광역시 서구 중소기업 현황’이었습니다. 3위와 4위에서도 기업 현황이 포함되는 것으로 보아 지역 내 기업 정보를 확인하고자 하는 시민들이 많다는 것을 알 수 있었습니다. 과학기술에서는 ‘인천광역시 부평구 CCTV 현황’이 1위를 차지했습니다. 특히 대다수의 자치행정기관들이 CCTV 현황과 와이파이 정보를 개방하고 있어 다른 데이터보다 보다 넓은 범위로 활용 가능했습니다.
특히 인천광역시의 경우 세 분야에서 순위 안에 4개의 데이터가 포함되며 가장 많은 데이터를 개방한 서울특별시보다도 경제적 파급효과와 활용도가 높은 데이터들을 많이 개방하고 있음을 확인할 수 있었습니다. 마지막으로 부가가치 유발효과가 높은 국토관리 분야에서 1위를 한 데이터는 ‘세종특별자치시의 지구단위계획 내용’이었습니다. 그 밖에도 산업단지 입주업체, 공동주택 현황, 개별공시지가 등이 높은 조회수를 기록했습니다.
다음으로는 비교적 순위가 낮은 데이터들을 살펴보겠습니다. 먼저 산업고용 분야에서 가장 낮은 조회수를 기록한 데이터는 ‘경기도 수원시 상가 정보’였습니다. 경기도 수원시의 경우 1위와 3위, 4위를 차지하며 경제적 파급효과가 가장 높은 산업고용 분야의 데이터 조회수가 전반적으로 모두 낮았습니다. 과학기술 분야 1위는 ‘경기도 오산시 주유소 현황’으로, 경기도 오산시 역시 1위 외에도 2위와 5위를 차지하며 해당 분야의 개방한 공공데이터의 파급효과가 낮은 편임을 알 수 있었습니다. 마지막으로 국토관리 분야에서 1위는 ‘경기도 오산시 공중화장실 현황’과 ‘전라북도 전주시 중개업소 정보’였고 경상북도 김천시가 이어서 3위를 차지했습니다.
해당 결과는 데이터 조회수만을 평가 기준으로 삼았으므로 자치행정기관들이 개방한 공공데이터의 경제적 가치를 정확히 측정하기에는 어느정도 한계가 있다고 할 수 있습니다. 하지만 자치행정기관들이 개방한 공공데이터가 얼마나 잘 활용되어지고 있고 그에 따라 어느 정도의 경제적 파급효과를 산출하고 있는지에 대해서 가늠하기에는 충분한 의미가 있습니다.
덧붙여 연구를 진행하면서 맞닥뜨린 애로사항 중 몇 가지를 공유하고자 합니다.
경제적 가치를 만드는 공공데이터 창출을 위해… 정부기관 더 노력해야
가장 먼저 공공데이터 포털에 연동되지 않은 데이터가 많았습니다. 특히 자체 공공데이터 포털을 운영하고 있는 자치행정기관들의 경우 모든 데이터를 공공데이터 포털에 업로드해 놓은 것이 아니었기 때문에 집계에 어려움이 있었습니다. 또한 공공데이터 포털에서는 공공데이터를 16가지로 분류해놓은 반면, 자치행정기관별로 분류 기준이 상이하여 같은 데이터라도 다르게 분류되어진 경우가 많았습니다. 이는 공공데이터를 이용하는 시민들에게 혼동이 될 수 있으므로 앞으로 정부기관들이 합의를 통해 개선해나가야할 부분입니다.
<The Open Data Economy Unlocking Economic Value, Capgemini Consulting(2013)>에서는 공공데이터의 경제적 가치 창출을 위해 정부가 해야하는 노력들을 다음과 같이 제시합니다. 첫 번째로 가능하고 실질적인 공공데이터의 이점에 대한 비전을 구축해야 합니다. 비전은 강력한 정치적 리더십과 함께 위로부터 내려오는 것이 일반적입니다. 두 번째로 공공데이터 개발을 촉진하기 위해 담당 기관을 개설해야 합니다. 대표적인 예로 지방자치단체별 공공데이터 포털 구축이 있습니다. 구축 후에는 전담 부서를 지정하여 지속적인 관리를 실행해야 합니다. 세 번째로 데이터의 구조화입니다. 데이터의 구조화는 데이터셋의 조회수와 다운로드수를 증가시키고 민간 개발자들이 데이터를 다양하게 활용하도록 돕습니다. 마지막으로 시민들과 기업들이 적극적으로 데이터를 사용하도록 장려해야 합니다. 실제로 많은 지방자치단체들이 공공데이터 활용을 위해 교육 세미나를 열고, 매년 공모전을 개최하며 공공데이터 사용을 권장하고 있습니다.
주기적으로 공공데이터의 가치를 산출하고 부족한 점을 찾아 개선해나가는 일련의 활동들은 매우 중요합니다. 공공데이터의 경제적 효과가 시민들의 공공데이터 활용에 달려있는 만큼 정부는 시민들이 사용할 만한 가치가 있는 데이터들을 제대로 구축하고 자체 평가 및 개선을 통해 끊임없이 발전해나가야 할 것입니다.
– 뉴스젤리 이경서 매니저 –