뉴스젤리 리포트
About public data
On July 13, the Ministry of Government Administration and Home Affairs announced that Korea ranked second in the “Open Public Data” survey conducted by the Organization for Economic Cooperation and Development (OECD) for the second time in a row. In addition, Korea’s public data openness index was 0.94 out of 1, which is significantly higher than the OECD average of 0.55 * . If our country is such an excellent field, it is likely that everyone will know and use it, but in reality, it seems that there are not many people to answer if you ask what public data is.
So what is public data? The Korea Information and Communications Technology Association defines public data in this way.
“Data or information processed in an optical or electronic way by a public entity, such as a database, an electronic file, etc., created or acquired for the purpose specified by laws and ordinances.”
Public data is literally any form of data that public authorities create or manage to perform their business. The 4th Industrial Revolution has just begun, and the 2016 World Economic Forum, which selected the 4th Industrial Revolution as an agenda , marked Big Data as one of the new core technology trends . As a result, Big Data has emerged as the core of the Fourth Industrial Revolution, with one major feature. That’s right, the data is not shrinking anyhow. The fact that many people share it does not reduce the amount of value they return to each other means that the more they share and utilize widely, the greater the total value. That’s why the whole world is paying attention to the opening of public data. As a result, it has become an important time for some public institutions to disclose a large amount of public data that has been created in the past, rather than limiting them, to the maximum number of people to utilize them and create economic added value.
In this global trend, our government is also publicizing Government 3.0 and opening public data. Government 3.0 It is a new government operation paradigm that is actively trying to open and share public information and to provide customized services to individual citizens in order to implement the government which owns the people of Iran.
오늘날 공공데이터는 국가 전반에 걸쳐서 방대한 양으로, 광범위하게 그리고 안정적으로 생산됩니다. 이것들은 그 자체로 가히 빅데이터라고 할 수 있으며, 업무상의 용도가 다 했다하더라도 그 가치를 아는 사람의 손에 들어갔을 때에 재활용되어 무궁무진한 가치를 지닐 수 있습니다. 지방자치단체의 교통 정보가 시민의 생활을 윤택하게 하는 대중교통 어플리케이션이 되어 나타나고, 한국관광공사와 기상청의 데이터는 숙박 예약 어플리케이션으로 변신* 합니다. 이처럼 현재에도 공공데이터의 활용은 알게 모르게 우리들의 생활에 녹아들고 있습니다.
- 공공데이터포털(https://www.data.go.kr/) 공공데이터 활용사례*
해외 공공데이터 개방 현황
다른 나라의 경우에는 어떨까요? 2000년대 후반부터 공공데이터 개방이 새로운 정책의 흐름이 되어 세계 각국으로 확산되고 있습니다. 공공데이터의 민간 개방을 ‘Open data’라고 지칭하며, 미국, EU, 호주 등 선진 각국은 법제화 및 관련 정책을 추진하고 있습니다. 대표적으로 미국에서는 2009년 오바마 정부가 ‘Open Government’를 표방하고 나서며 정부기관 전체 차원의 연방 데이터 저장소를 구축하겠다는 계획안을 발표하였고, 이보다 빠른 2003년 11월 EU에서는 ‘공공정보의 재활용에 대한 지침(Directive on Re-use of Public Sector Information)’을 제정하였습니다. 이처럼 각국에서 이미 10여 년 전부터 법제화의 움직임이 있었던 것에 비하면, 2013년 10월에야 공공데이터법이 제정된 우리나라는 다소 늦은 편*이라고 할 수 있습니다.
- 사용자 중심의 공공데이터 경제적 가치 측정모델 개발 및 적용 연구, 한국지역정보개발원 (2016)*
공공데이터 활용의 잠재적 효과 측정 방법
이렇게 전세계가 주목하고 있는 공공데이터, 하지만 공공데이터 개방에 따른 영향력이 막상 어느 정도일지는 누구도 명확히 알기가 어렵습니다. 세계 각지에서 연구가 활발하게 이루어지고 있음에도 아직 공식적인 평가 방법은 없기 때문입니다. 이번 리포트에서는 공공데이터 이용에 따른 다양한 효과 중에서도 특히 공공부문의 ‘비용절감’에 대한 효과를 측정하기 위해 여러 방법론 중 하나인 맥킨지 보고서의 분석 방법을 적용해 보았습니다. 해당 방법론은 맥킨지 글로벌 연구소(McKinsey Global Institute)의 분석틀(2011)* 로 국내 논문에서도 활용** 된 바 있습니다.
- McKinsey Global Institute(MGI), 2011, Big data : The next frontier for innovation, competition, and productivity*
- 서울연구원, 2013, 최봉, 빅데이터 활용과 정보공개의 경제적 효과 분석**
분석틀을 적용하기에 앞서 짚어보아야할 것은 빅데이터와 공공데이터의 관계입니다. 공공데이터는 빅데이터의 일부로, 공개된 데이터 중에서도 공공부문이 만들어낸 정보, 즉 공개된 공공부문 데이터를 뜻합니다. 따라서 앞으로 분석할 공공부문에 사용된 빅데이터란 공공데이터를 의미한다고 볼 수 있습니다.
맥킨지의 분석틀에서는 다음 세 가지 관점에서 공공부문 빅데이터 이용에 따른 정부의 잠재적 비용절감 효과를 측정합니다.
- 조직을 효율화하고, 업무의 순서를 조정하는데 있어서 객관성을 높여 정부 운영의 비용이 감소하는 것을 기대하는 효율성 관점의 비용절감.
- 사회복지제도에서 생기는 부정수급과 보조금 과다 지급 등의 낭비 방지를 기대하는 부정 및 오류 감소 관점의 비용절감.
- 부과된 세금과 실제 징수된 금액 간의 격차를 줄이기 위한 방안의 모색을 기대하는 조세 제도 관점의 비용절감.
분석을 위한 기본 값은 각각 다음과 같이 설정하였습니다.
- 효율성의 관점(시정 운영에 따른 비용 절감)에서는 각 지자체의 총 지출액
- 복지 제도의 부정 방지 관점에서는 사회복지 지출액
- 조세 제도 관점에서는 일반회계 세입액
여기에 맥킨지 분석틀에서 적용한 각 항목별 빅데이터 적용가능 비율과 비용절감 효과[Table 1 참조]를 적용해 최종 절감가능액을 산출합니다.* 본 분석틀에서는 최대값과 최소값을 지정해주고 있지만 본 기사에서는 최소값만을 사용하였습니다.
- 서울연구원, 2013, 최봉, 빅데이터 활용과 정보공개의 경제적 효과 분석 참고*
지방자치단체별 빅데이터 이용시 공공부문 비용절감효과 분석
Mckinsey 분석툴(2011)을 적용한 상기 조사결과에 따르면 비용절감 가능액에서 가장 큰 효과를 보는 지방자치단체는 서울시인 것으로 나타났으며, 그 다음을 경기도와 부산광역시, 인천광역시 등이 뒤따르고 있습니다. 지자체별 인구수*와 총 지출액 지표 간에 높은 관련성을 보이는 결과가 나타난 것으로 보아 혜택을 보는 인구가 많고, 빅데이터를 적용해야할 세금의 액수가 클수록 빅데이터 이용을 통한 공공부문의 비용절감효과가 크다고 할 수 있습니다.
- 2017년 도시별 인구수(행정자치부) 1위 경기도, 2위 서울, 3위 경상남도, 4위 부산, 5위 인천 상위 다섯 도시가 동일. 6위 경상북도, 7위 대구 또한 같은 순위로 관련성이 있다고 판단하였음*
표의 내용을 데이터 시각화 솔루션 데이지를 통해 시각화해보았습니다.
수치적인 통계 데이터를 시각화 차트로 비교해보니 앞서 설명한 것과 같이 서울특별시와 경기도, 부산광역시가 확연히 강조되며, 다른 지자체에 비해 큰 효과를 볼 수 있는 것으로 나타났습니다. 특히 서울시의 비용절감 가능액은 약 9,500억원으로 7,500억 원대로 나타난 부산광역시에 비해 약 21%, 3,800억 원대로 나타난 경기도에 비해 약 60% 이상 더 높게 나타났습니다. 결과적으로 서울의 경우, 최소 연간 총 지출액[Table 2 참고]의 3.4%를 절감할 수 있다는 결과가 나타납니다. 지금까지 민간부문을 포함하지 않은 공공부문에서의 활용만으로도 이러한 경제적 효과를 낼 수 있다는 것을 확인해보았습니다.
그렇다면 이러한 잠재력을 가지고 있는 공공데이터를 지자체에서는 얼마나 잘 관리하고 있을까요? 이를 알아보기 위해 각 지방자치단체에서 보유한 공공데이터의 데이터셋 수를 조사하였습니다. 데이터셋이란 관련된 자료의 집합체를 이르는 말로, 보통 공공데이터는 데이터셋 단위로 업로드됩니다. 데이터셋의 수 만으로 공공데이터 관리의 전부를 평가할 수는 없지만, 어느 정도로 정보를 전자화하고, 공개하려는 노력을 보이는지에 대한 대략적인 판단의 기준은 될 수 있을 것입니다.
이에 대하여는 각 지자체 별로 공공데이터 관리 방법이 모두 다르기 때문에 전체 공공데이터 포털(data.go.kr, 이하 공공 포털)과 지방자치단체의 자체 공공데이터 포털(이도 없을 경우 지자체 홈페이지, 이하 자체 포털)의 데이터셋 보유수를 모두 조사하였으며, 그 중 높은 값을 가진 수로 순위를 산정하였습니다.
공공데이터의 관리 현황 조사
조사 결과, 이전 조사에서 비교적 높은 비용절감 가능액을 보였던 서울시와 인천시, 경기도, 부산시의 경우 데이터셋 보유 수 역시 상대적으로 많은 값을 가지는 것으로 나타나며, 데이터 활용 효과와 관리 지표간 연관성을 보였습니다. 특히 강원도와 전라북도의 경우, 이전 조사에서는 비용절감 가능액 부문이 비교적 낮은 수치로 나타났음에도 불구하고, 데이터셋 보유수 기준 공공데이터를 관리하는 측면에서는 상대적으로 우수한 모습을 보입니다.
여기서 주목해야할 점은 공공 포털과 자체 포털 간 데이터셋 보유 수의 차이가 대부분 크다는 것입니다. 이것은 한 가지 포털만 이용할 경우 원하는 데이터를 찾기 용이하지 않을 수 있고, 공공데이터의 통합적인 관리가 미흡할 수 있음을 시사합니다. 따라서 공공데이터 활용 시 비용절감 가능액은 높지만, 데이터셋 보유 수가 상대적으로 적게 나온다면 데이터 관리에 있어서 지자체의 관심과 노력이 필요할 것입니다.
산점도의 세로축은 자체 공공데이터 포털의 데이터셋 보유수이고, 가로축은 공공포털에 각 지자체가 올려놓은 데이터셋의 개수입니다. 산점도에서 나타나는 원형 지표들의 크기는 자체 포털과 공공포털의 데이터셋 개수 중 큰 쪽의 값으로 순위를 측정하는데 사용한 값입니다. 이러한 산점도를 이용하면 지자체 별 자체 포털과 공공 포털의 데이터셋 보유수의 차이를 좀 더 명확히 확인할 수 있습니다.
공공데이터 활용에 앞장서는 서울시
앞서 살펴본 두 조사에 따르면 특히 서울특별시는 다른 지자체에 비해 연속해서 상대적으로 높은 결과값을 나타낸 것을 확인할 수 있습니다. 즉, 이는 서울특별시가 공공데이터 활용에 따른 부가가치 창출 효과가 높고, 관리에도 심혈을 기울이고 있다는 것을 뜻합니다. 그렇다면 이렇게 공공데이터 관리부문에서 우수한 성적을 보이는 서울시는 실제로 어떠한 데이터 정책을 펼치고 있을까요?
먼저, 서울시는 ‘열린 시정 2.0’이라는 모토 하에 서울 열린 데이터 광장(http://data.seoul.go.kr/)에서 데이터를 적극적으로 개방하고 있습니다. 이를 통해 어떠한 공공데이터들이 있는지 살펴볼 수 있습니다. 또 필요한 데이터는 어디서 찾아볼 수 있는 지를 안내하거나 검색을 통해 원하는 데이터를 자유롭게 다운로드 받을 수 있도록 하고 있습니다.
이 외에도 공공데이터 개방 프로세스 수립 진행에 앞서, 공무원의 가이드라인을 마련한 것도 주목할 만한 행보입니다. 이 가이드라인에는 공공데이터를 개방해야하는 이유에 대한 기본적인 이해와 단계별 절차, 계획을 포함하고 있습니다. 이에 더해, 공공데이터 관리를 추진함에 있어서 국내외의 여러 공공데이터 분류체계를 분석, 참고하여 10개의 분야로 구분하고 있으며, 그 아래에 더욱 상세한 하위 분류를 구성하고 있습니다. 그 외에도 25개 자치구에서 공동으로 운영 중인 시스템의 데이터는 열린 데이터 광장에서 개방을 통한 공동활용을 도모하고, 자체적으로 운영하는 시스템은 자치구의 플랫폼을 통하여 개방되도록 하는 등 모범사례를 보이고 있습니다.*
- 사용자 중심의 공공데이터 경제적 가치 측정모델 개발 및 적용 연구, 한국지역정보개발원 (2016)*
Although this report deals only with the effects of data used in the public sector, the effect of real public data being actively used in the private sector is more than just economic value. To this end, local governments are expected to actively encourage citizens to use public data. In the future, the awareness of openness and utilization of public data will increase, and each institution will open the public data actively and expect the Republic of Korea to utilize it for better value.
– 2017-08-31 News Jelly Sung Hye- jin