On 8월 31, 2017

[뉴스젤리 리포트] 지자체별 공공데이터 활용의 잠재적 효과와 관리 현황 분석

공공데이터에 대하여

지난 7월 13일 행정자치부가 밝힌 바에 의하면 경제협력개발기구(OECD)가 실시한 ‘공공데이터 개방’ 조사에서 한국이 2회 연속 1위를 달성했다고 합니다. 이뿐만 아니라 한국의 공공데이터 개방 지수는 1점 만점에 0.94점으로 OECD 회원국 평균(0.55)보다 크게 높은 수준으로 평가*되었습니다.  우리나라가 이렇게 우수한 분야라면 국민들 누구나 그 존재를 알고 유용하게 사용할 것만 같은데, 실제로 ‘공공데이터’가 무엇이냐고 물으면 대답할 사람은 많지 않은 것 같습니다.

 

OECD 공공데이터개방 종합 순위

OECD 공공데이터개방 종합 순위(출처: 연합뉴스)

그렇다면 여기서 말하는 공공데이터란 무엇일까요? 한국정보통신기술협회에서는 공공데이터를 이렇게 정의합니다.

 

“데이터베이스, 전자화된 파일 등 공공기관이 법령 등에서 정하는 목적을 위하여 생성 또는 취득하여 관리하고 있는 광 또는 전자적 방식으로 처리된 자료 또는 정보.”

 

공공데이터는 말 그대로 공공기관이 업무를 수행하기 위해 생성하거나 관리하는 모든 형태의 자료를 의미합니다. 바야흐로 4차 산업혁명이 시작되었고, 이 4차 산업혁명을 의제로 선정한 2016년 세계경제포럼은 새로운 핵심 기술 트렌드 중 하나로 빅데이터를 지목하였습니다. 이에 따라 빅데이터는  4차 산업혁명의 핵심으로 부상하게 되었는데, 한 가지 주요한 특징이 있습니다. 바로 데이터는 아무리 나누어도 줄어들지 않는다는 것입니다. 많은 사람이 함께 공유해도 각자에게 돌아가는 가치의 양이 줄어들지 않는다는 것은 널리 공유하고 활용할수록 총 가치가 커진다는 것을 의미합니다. 이것이 바로 전 세계가 공공데이터 개방에 주목하는 이유입니다. 이에 따라 일부의 공공기관이 기존에 만들어진 수많은 공공데이터들을 한정하여 보유하기 보다는 전면에 공개하여 최대한 많은 사람들이 이를 활용하고 이를 통해 경제적 부가가치를 창출하도록 이끄는 것이 중요한 시대가 되었습니다.

이러한 세계의 흐름 속에 우리 정부 또한 정부 3.0을 표방하며 공공데이터를 개방하고 있습니다. 정부 3.0이란 국민이 주인인 정부를 구현하기 위해 공공정보를 적극 개방· 공유하고, 국민 개개인에 대해 맞춤형 서비스를 제공하기 위해 노력하는 새로운 정부 운영의 패러다임입니다.

오늘날 공공데이터는 국가 전반에 걸쳐서 방대한 양으로, 광범위하게 그리고 안정적으로 생산됩니다. 이것들은 그 자체로 가히 빅데이터라고 할 수 있으며, 업무상의 용도가 다 했다하더라도 그 가치를 아는 사람의 손에 들어갔을 때에 재활용되어 무궁무진한 가치를 지닐 수 있습니다. 지방자치단체의 교통 정보가 시민의 생활을 윤택하게 하는 대중교통 어플리케이션이 되어 나타나고, 한국관광공사와 기상청의 데이터는 숙박 예약 어플리케이션으로 변신* 합니다. 이처럼 현재에도 공공데이터의 활용은 알게 모르게 우리들의 생활에 녹아들고 있습니다.

  • 공공데이터포털(https://www.data.go.kr/) 공공데이터 활용사례*

 

해외의 공공데이터 개방 현황은 어떨까?

해외의 공공데이터 개방 현황은 어떨까?

해외 공공데이터 개방 현황

다른 나라의 경우에는 어떨까요? 2000년대 후반부터 공공데이터 개방이 새로운 정책의 흐름이 되어 세계 각국으로 확산되고 있습니다. 공공데이터의 민간 개방을 ‘Open data’라고 지칭하며, 미국, EU, 호주 등 선진 각국은 법제화 및 관련 정책을 추진하고 있습니다. 대표적으로 미국에서는 2009년 오바마 정부가 ‘Open Government’를 표방하고 나서며 정부기관 전체 차원의 연방 데이터 저장소를 구축하겠다는 계획안을 발표하였고, 이보다 빠른 2003년 11월  EU에서는 ‘공공정보의 재활용에 대한 지침(Directive on Re-use of Public Sector Information)’을 제정하였습니다. 이처럼 각국에서 이미 10여 년 전부터 법제화의 움직임이 있었던 것에 비하면, 2013년 10월에야 공공데이터법이 제정된 우리나라는 다소 늦은 편*이라고 할 수 있습니다.

  • 사용자 중심의 공공데이터 경제적 가치 측정모델 개발 및 적용 연구, 한국지역정보개발원 (2016)*

공공데이터 활용의 잠재적 효과 측정 방법

이렇게 전세계가 주목하고 있는 공공데이터, 하지만 공공데이터 개방에 따른 영향력이 막상 어느 정도일지는 누구도 명확히 알기가 어렵습니다. 세계 각지에서 연구가 활발하게 이루어지고 있음에도 아직 공식적인 평가 방법은 없기 때문입니다. 이번 리포트에서는 공공데이터 이용에 따른 다양한 효과 중에서도 특히 공공부문의 ‘비용절감’에 대한 효과를 측정하기 위해 여러 방법론 중 하나인 맥킨지 보고서의 분석 방법을 적용해 보았습니다. 해당 방법론은 맥킨지 글로벌 연구소(McKinsey Global Institute)의 분석틀(2011)*  로 국내 논문에서도 활용** 된 바 있습니다.

  • McKinsey Global Institute(MGI), 2011, Big data : The next frontier for innovation, competition, and productivity*
  • 서울연구원, 2013, 최봉, 빅데이터 활용과 정보공개의 경제적 효과 분석**

분석틀을 적용하기에 앞서 짚어보아야할 것은 빅데이터와 공공데이터의 관계입니다. 공공데이터는 빅데이터의 일부로, 공개된 데이터 중에서도 공공부문이 만들어낸 정보, 즉 공개된 공공부문 데이터를 뜻합니다. 따라서 앞으로 분석할 공공부문에 사용된 빅데이터란 공공데이터를 의미한다고 볼 수 있습니다.

 

Figure 1 데이터 관계도

Figure 1 데이터 관계도 – 서울연구원, 2013, 최봉, 빅데이터 활용과 정보공개의 경제적 효과 분석 논문에서 나온 그림을 재구성

 

맥킨지의 분석틀에서는 다음 세 가지 관점에서 공공부문 빅데이터 이용에 따른 정부의 잠재적 비용절감 효과를 측정합니다.

  1. 조직을 효율화하고, 업무의 순서를 조정하는데 있어서 객관성을 높여 정부 운영의 비용이 감소하는 것을 기대하는 효율성 관점의 비용절감.
  2. 사회복지제도에서 생기는 부정수급과 보조금 과다 지급 등의 낭비 방지를 기대하는 부정 및 오류 감소 관점의 비용절감.
  3. 부과된 세금과 실제 징수된 금액 간의 격차를 줄이기 위한 방안의 모색을 기대하는 조세 제도 관점의 비용절감.

 

분석을 위한 기본 값은 각각 다음과 같이 설정하였습니다.

  1. 효율성의 관점(시정 운영에 따른 비용 절감)에서는 각 지자체의 총 지출액
  2. 복지 제도의 부정 방지 관점에서는 사회복지 지출액
  3. 조세 제도 관점에서는 일반회계 세입액

여기에 맥킨지 분석틀에서 적용한 각 항목별 빅데이터 적용가능 비율과 비용절감 효과[Table 1 참조]를 적용해 최종 절감가능액을 산출합니다.* 본 분석틀에서는 최대값과 최소값을 지정해주고 있지만 본 기사에서는 최소값만을 사용하였습니다.

  • 서울연구원, 2013, 최봉, 빅데이터 활용과 정보공개의 경제적 효과 분석 참고*
Table 1 분석틀 항목 정리 * **  맥킨지 연구소에서 유럽의 공공부문을 기준으로 추정한 비율

Table 1 분석틀 항목 정리 * ** 맥킨지 연구소에서 유럽의 공공부문을 기준으로 추정한 비율

 


지방자치단체별 빅데이터 이용시 공공부문 비용절감효과 분석

 

Mckinsey 분석툴(2011)을 적용한 상기 조사결과에 따르면 비용절감 가능액에서 가장 큰 효과를 보는 지방자치단체는 서울시인 것으로 나타났으며, 그 다음을 경기도 부산광역시, 인천광역시 등이 뒤따르고 있습니다. 지자체별 인구수*와 총 지출액 지표 간에 높은 관련성을 보이는 결과가 나타난 것으로 보아 혜택을 보는 인구가 많고, 빅데이터를 적용해야할 세금의 액수가 클수록 빅데이터 이용을 통한 공공부문의 비용절감효과가 크다고 할 수 있습니다.

  • 2017년 도시별 인구수(행정자치부) 1위 경기도, 2위 서울, 3위 경상남도, 4위 부산, 5위 인천 상위 다섯 도시가 동일. 6위 경상북도, 7위 대구 또한 같은 순위로 관련성이 있다고 판단하였음*

 

표의 내용을 데이터 시각화 솔루션 데이지를 통해 시각화해보았습니다.

Figure 2 비용절감효과 버블맵(좌), Figure 3 비용절감효과 워드클라우드 맵

Figure 2 비용절감효과 버블맵(좌), Figure 3 비용절감효과 워드클라우드 맵(우)

 

수치적인 통계 데이터를 시각화 차트로 비교해보니 앞서 설명한 것과 같이 서울특별시와 경기도, 부산광역시가 확연히 강조되며, 다른 지자체에 비해 큰 효과를 볼 수 있는 것으로 나타났습니다.  특히 서울시의 비용절감 가능액은 약 9,500억원으로 7,500억 원대로 나타난 부산광역시에 비해 약 21%, 3,800억 원대로 나타난 경기도에 비해 약 60% 이상 더 높게 나타났습니다. 결과적으로 서울의 경우, 최소 연간 총 지출액[Table 2 참고]의 3.4%를 절감할 수 있다는 결과가 나타납니다. 지금까지 민간부문을 포함하지 않은 공공부문에서의 활용만으로도 이러한 경제적 효과를 낼 수 있다는 것을 확인해보았습니다.

그렇다면 이러한 잠재력을 가지고 있는 공공데이터를 지자체에서는 얼마나 잘 관리하고 있을까요? 이를 알아보기 위해 각 지방자치단체에서 보유한 공공데이터의 데이터셋 수를 조사하였습니다. 데이터셋이란 관련된 자료의 집합체를 이르는 말로, 보통 공공데이터는 데이터셋 단위로 업로드됩니다. 데이터셋의 수 만으로 공공데이터 관리의 전부를 평가할 수는 없지만, 어느 정도로 정보를 전자화하고, 공개하려는 노력을 보이는지에 대한 대략적인 판단의 기준은 될 수 있을 것입니다.

이에 대하여는 각 지자체 별로 공공데이터 관리 방법이 모두 다르기 때문에 전체 공공데이터 포털(data.go.kr, 이하 공공 포털)과 지방자치단체의 자체 공공데이터 포털(이도 없을 경우 지자체 홈페이지, 이하 자체 포털)의 데이터셋 보유수를 모두 조사하였으며, 그 중 높은 값을 가진 수로 순위를 산정하였습니다.

 

공공데이터의 관리 현황 조사

 

조사 결과, 이전 조사에서 비교적 높은 비용절감 가능액을 보였던 서울시와 인천시, 경기도, 부산시의 경우 데이터셋 보유 수 역시 상대적으로 많은 값을 가지는 것으로 나타나며, 데이터 활용 효과와 관리 지표간 연관성을 보였습니다. 특히 강원도와 전라북도의 경우, 이전 조사에서는 비용절감 가능액 부문이 비교적 낮은 수치로 나타났음에도 불구하고, 데이터셋 보유수 기준 공공데이터를 관리하는 측면에서는 상대적으로 우수한 모습을 보입니다.

여기서 주목해야할 점은 공공 포털과 자체 포털 간 데이터셋 보유 수의 차이가 대부분 크다는 것입니다. 이것은 한 가지 포털만 이용할 경우 원하는 데이터를 찾기 용이하지 않을 수 있고, 공공데이터의 통합적인 관리가 미흡할 수 있음을 시사합니다. 따라서 공공데이터 활용 시 비용절감 가능액은 높지만, 데이터셋 보유 수가 상대적으로 적게 나온다면 데이터 관리에 있어서 지자체의 관심과 노력이 필요할 것입니다.

 

Figure 4 지방자치단체별 데이터셋 보유순위 막대그래프(좌), Figure 5 지방자치단체별 데이터셋 보유수 산점도(우)

Figure 4 지방자치단체별 데이터셋 보유순위 막대그래프(좌), Figure 5 지방자치단체별 데이터셋 보유수 산점도(우)

 

산점도의 세로축은 자체 공공데이터 포털의 데이터셋 보유수이고, 가로축은 공공포털에 각 지자체가 올려놓은 데이터셋의 개수입니다. 산점도에서 나타나는 원형 지표들의 크기는 자체 포털과 공공포털의 데이터셋 개수 중 큰 쪽의 값으로 순위를 측정하는데 사용한 값입니다. 이러한 산점도를 이용하면 지자체 별 자체 포털과 공공 포털의 데이터셋 보유수의 차이를 좀 더 명확히 확인할 수 있습니다.

 

공공데이터 활용에 앞장서는 서울시

서울열린데이터광장(http://data.seoul.go.kr/) 포털화면

서울열린데이터광장(http://data.seoul.go.kr/) 포털화면

앞서 살펴본 두 조사에 따르면 특히 서울특별시는 다른 지자체에 비해 연속해서 상대적으로 높은 결과값을 나타낸 것을 확인할 수 있습니다. 즉, 이는 서울특별시가 공공데이터 활용에 따른 부가가치 창출 효과가 높고, 관리에도 심혈을 기울이고 있다는 것을 뜻합니다. 그렇다면 이렇게 공공데이터  관리부문에서 우수한 성적을 보이는 서울시는 실제로 어떠한 데이터 정책을 펼치고 있을까요?

먼저, 서울시는 ‘열린 시정 2.0’이라는 모토 하에 서울 열린 데이터 광장(http://data.seoul.go.kr/)에서 데이터를 적극적으로 개방하고 있습니다. 이를 통해 어떠한 공공데이터들이 있는지 살펴볼 수 있습니다. 또 필요한 데이터는 어디서 찾아볼 수 있는 지를 안내하거나 검색을 통해 원하는 데이터를 자유롭게 다운로드 받을 수 있도록 하고 있습니다.

이 외에도 공공데이터 개방 프로세스 수립 진행에 앞서, 공무원의 가이드라인을 마련한 것도 주목할 만한 행보입니다. 이 가이드라인에는 공공데이터를 개방해야하는 이유에 대한 기본적인 이해와 단계별 절차, 계획을 포함하고 있습니다. 이에 더해, 공공데이터 관리를 추진함에 있어서 국내외의 여러 공공데이터 분류체계를 분석, 참고하여 10개의 분야로 구분하고 있으며, 그 아래에 더욱 상세한 하위 분류를 구성하고 있습니다. 그 외에도 25개 자치구에서 공동으로 운영 중인 시스템의 데이터는 열린 데이터 광장에서 개방을 통한 공동활용을 도모하고, 자체적으로 운영하는 시스템은 자치구의 플랫폼을 통하여 개방되도록 하는 등 모범사례를 보이고 있습니다.*

  • 사용자 중심의 공공데이터 경제적 가치 측정모델 개발 및 적용 연구, 한국지역정보개발원 (2016)*

 

서울 공공데이터 분류체계

서울 공공데이터 분류체계

 

본 리포트에서는 공공부문에서 활용되는 데이터의 효과만을 다루었지만, 실제 공공데이터가 민간에서 활발히 활용될 경우 발생하는 효과는 단순한 경제적 가치 그 이상일 것입니다. 이를 위해 각 지방자치단체들은 시민들의 공공데이터 활용을 적극적으로 장려해야할 것으로 보입니다. 앞으로 공공데이터 개방과 활용에 대한 의식이 더욱 높아지고, 이를 통해 각 기관은 공공데이터를 적극적으로 개방하며 국민은 이를 활용해 더 나은 가치를 찾아가는 대한민국을 기대해봅니다.

– 2017-08-31 뉴스젤리 성혜진

  • By 뉴스젤리  2 Comments   1
  • 공공데이터, 뉴스젤리, 데이지, 공공데이터리서치, 공공데이터보고서, 서울열린데이터광장, 지자체별데이터, 공공데이터관리, 공공데이터효과, 빅데이터활용, 지방자치단체별데이터이용, 데이터이용현황, 국내공공데이터분석
  • 2 Comments

    Posted by 이상민 on
    • 9월 1 2017
    응답  
    좋은 글 잘 봤습니다. 제가 최근에 읽은 공공데이터포털 분석은 비슷하지만 다른 맥락을 보여줍니다. 잠재적 가치가 아닌 현재 공공데이터 수준에 대한 직관적인 분석입니다. https://brunch.co.kr/@haklaekim/3 https://brunch.co.kr/@haklaekim/7 https://brunch.co.kr/@haklaekim/6 https://brunch.co.kr/@haklaekim/8
      Posted by 뉴스젤리 on
      • 9월 4 2017
      응답  
      네 의견 감사드립니다.^^ 다음 발행예정인 공공데이터 리포트는 이번 편보다 좀 더 분석적인 면에 깊이있게 들어간 내용으로 발행될 예정입니다. 앞으로도 많은 관심 부탁드립니다. 참조해주신 사이트는 저희도 참고해보도록 하겠습니다. 감사합니다~

    Leave a Reply

    이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.

    2 × 5 =