On 10월 26, 2017

[데이터 리포트] 광역자치단체 공공데이터의 종류별 품질 평가 및 시사점

한국 공공데이터 개방지수는 1등, 품질은?

공공데이터를 이용해 본 적 있나요? 정부는 공공데이터 제공 및 이용 활성화에 관한 법률에 의해 공공데이터를 적극적으로 개방하려고 노력하고 있습니다. 데이터 개방을 통해 정부는 시민들로 하여금 정부가 어떤 일을 하는지 이해하게 함으로써 투명성과 책임성을 강화하는 것을 목표로 합니다. 단순히 정부의 성과를 향상시키는 것 뿐만 아니라 공개된 데이터를 이용해 생활에 도움이 되는 혁신적인 서비스를 창출하고 개인의 의사결정을 개선하는 것도 주된 목적입니다.

이러한 목적을 달성하기 위해서는 단순히 정부가 데이터를 개방하는 것뿐만 아니라 대중의 관심과 참여도 중요합니다. 개방한 데이터의 양이 많다고 시민들이 활발하게 이용을 할까요? 시민들이 누구나 쉽고 편리하게 데이터를 찾아서 활용할 수 있도록 환경을 조성해줘야 할 것입니다. 따라서 우수한 품질의 데이터를 통해 대중 친화적인 데이터 사용환경을 만드는 것이 중요합니다.

OECD 공공데이터 개방평가 현황. 한국(KOR)이라고 표기된 가장 좌측 막대그래프의 지표가 OECD 국가 중 가장 높은 것으로 나타났다.(출처: <a href="http://www.oecd-ilibrary.org/governance/government-at-a-glance-2017/open-government-data_gov_glance-2017-68-en">OECD Survey on open Government Data</a>)

OECD 공공데이터 개방평가 현황. 한국(KOR)이라고 표기된 가장 좌측 막대그래프의 지표가 OECD 국가 중 가장 높은 것으로 나타났다.(출처: OECD Survey on open Government Data)

 

공공데이터 품질 평가를 위한 사전 준비

2017년 현재 우리나라는 OECD 공공데이터 개방평가에서 2회 연속 1위를 달성했습니다. [1]한마디로 현재 우리나라의 데이터 개방 정도는 우수합니다. 하지만 앞서 말했듯 더 중요한 것은 데이터의 품질입니다. 이용하기 쉽고 활용 잠재력이 높은 양질의 데이터가 많을수록 공공데이터 개방의 파급효과가 커지므로 현재 상황을 점검해서 품질을 보완해나가는 과정이 필요합니다.

이를 위해 데이터 시각화 솔루션 전문기업 뉴스젤리는 Open Data Barometer (이하 ODB)의 실행지수 조사방법론[2]을 적용해 국내 광역 자치단체가 개방한 공공데이터의  품질을 조사했습니다. Open Data Barometer는 국제기구 월드와이드웹 재단(World Wide Web Foundation)가 매년 각국의 공공데이터 개방을 준비지수, 실행지수, 영향지수로 나누어 각각을 100점 만점으로 환산해 평가한 지표를 발표한 결과입니다.

[1] 한국, OECD 공공데이터개방 평가서 2회 연속 1위 (연합뉴스, 2017.7.13)
[2] Open Data Barometer 4th edition Research Handbook – v1.0 (2016.6)

 

각 지수에 대해 소개하자면 먼저 ‘준비 지수’는 공공데이터 개방 준비를 위한 사전 전략이나 교육, 법, 활동 등을 정부, 기업, 시민의 3영역에서 전문가의 설문조사를 통해 산출합니다.

다음으로 ‘실행 지수’는 한 국가가 실제로 개방할만한 데이터를 지도, 기관 통계, 기관 예산, 기관 지출, 기업 명부, 법률, 대중교통 시간표, 의료 성과, 교육 성과, 범죄 통계, 환경 데이터, 공공계약 데이터, 무역 데이터, 선거 결과, 토지 소유 데이터의 15개 종류로 나누어 각각 평가를 시행합니다. 각 종류를 Table 1에서 제시된 10개 항목으로 조사한 다음 각 항목에 특정 가중치를 적용해 100점 만점으로 환산하는 방식으로 개별 데이터 종류를 평가합니다. 그리고 개별 데이터 점수 결과의 평균값으로 국가의 데이터 실행 총점을 매깁니다.

마지막으로 ‘영향 지수’는 정치, 사회, 경제의 3분야에서 공공데이터가 미친 영향을 전문가 설문조사로 평가합니다.

 

다만, 뉴스젤리는 이번에 시행한 공공데이터 품질 평가에서 ODB의 실행 지수만을 이용하여 조사했습니다. 이유는 크게 3가지입니다. 먼저 직접적으로 공공데이터 자체를 다루는 지표가 실행 지수 뿐입니다. 준비 지수는 데이터 개방을 위한 사전 작업을 평가하는 것이고, 영향 지수는 데이터 개방의 파급 효과를 측정하기에 공공데이터의 질을 직접 다루지는 않습니다. 반면 실행 지수는 사용자 친화성, 활용 가능성의 관점에서 직접적으로 데이터 품질을 다루는 지표라고 할 수 있습니다.

☞ 뉴스젤리 공공데이터 품질평가에 활용된 실행지수 조사결과 자세히 보기

또한, 준비 지수와 영향 지수는 단일 지자체를 위한 지표로 가공하기가 어렵다는 것도 하나의 이유입니다. 준비 지수는 데이터 개방 인프라에 관한 것이기에 단일 지자체에 국한되지 않고 정부나 시민의 행보가 지수에 큰 영향을 미칩니다. 또 개인이 특정 지자체의 데이터만 사용하는 것은 아니기 때문에 영향 지수에서도 단일 지자체의 영향력만 분리해서 평가하기가 사실상 불가능합니다. 반면 실행 지수는 데이터 개방 실태만을 평가하는 것이므로 자치단체 각각의 데이터를 평가하는 데 적합합니다.

마지막으로 실행지수가 상대적으로 정량화 가능성이 높습니다. 준비지수나 영향 지수는 점수를 산정하기 위해서 언론 등을 보고 복잡한 판단 과정을 거쳐야 하는 반면 실행지수는 앞서 설명한 15개의 데이터 종류까지 정해진 가운데 각 종류별로 세부적인 평가 대상 데이터를 잘 정의한다면 데이터에 포함된 요소의 존재 유무에 따라 이분법적으로 비교적 단순한 평가를 할 수 있습니다.

이 외에도 각 광역자치단체를 일관되게 평가하기 위해서는 평가 대상인 12가지 종류의 데이터에 대해 보다 세부적인 정의가 필요합니다. 이번 조사에서는 평가할 데이터의 구체적인 정의를 다음과 같이 내렸습니다.

평가할 공공데이터 종류의 구체적 정의

각 광역자치단체의 일관적인 평가를 위해, 평가 대상인 데이터를 세부적으로 정의하였다. 총 12개의 항목 중 주요 데이터 항목 정의만을 선별해보았다.

※ 만약 특정 종류 데이터가 예를 들어 데이터 포털, 통계 포털, 청사 홈페이지 중 복수의 소스에 존재한다면 점수가 더 높은 것을 선택

※ 광역자치단체를 평가하기 위해 데이터 종류 중 중앙기관이 주로 관리하는 것으로 판단되는 무역 데이터, 선거 결과, 토지 소유 데이터는 이번 평가 대상에서 제외했습니다.

 

지자체별 공공데이터 품질 평가 점수 실태
“100점 만점에 전체 평균 31.6점, 하향치 겉돌아”

광역자치단체 공공데이터 품질 자체 평가 점수

광역자치단체 공공데이터 품질 자체 평가 점수

이러한 전제를 바탕으로 최종 집계한 결과, 총 17개의 자치단체 중 서울시가 약 57점을 기록하며 가장 우수한 성적을 보였습니다. 이 외 대부분의 자치단체는 20점대 중반에서 30점대에 분포되어 있었습니다. 여기서 주목해야할 점은 본 평가지수의 총점이 100점 만점인 것을 감안하면 국내 자치단체들의 데이터 활용 정도는 전반적으로 높지 않다는 것입니다. 어째서 이런 결과가 나타난 것일까요?

※ 각 자치단체 공공데이터 포털, 중앙 공공데이터 포털 및 청사 홈페이지, 기관 산하 기타 하위 포털 (통계, 교통 정보 등)에 의거

※ 각 자치단체의 데이터 종류 별 자세한 점수와 구체적 산정 기준, 이유는 아래의 데이터 평가 문서에서 확인하실 수 있습니다.

☞ 데이터 평가 문서 원본보기

 

지자체 공공데이터 품질평가에서의 주요 시사점

1. 여러 곳에 산재되어 있는 자치단체의 공공데이터

1)여러 곳에 산재되어 있는 자치단체의 공공데이터

여러 곳에 산재되어 있는 자치단체의 공공데이터

광역자치단체 공공데이터 평가를 하면서 가장 눈에 띄는 것은 여러 종류의 데이터를 한 곳에서 찾기 힘들다는 점이었습니다. 위 사진들은 항목별로 데이터를 찾는 데 이용한 인천광역시 산하 사이트들입니다. 인천광역시의 경우 자체 데이터 포털이나 공공데이터포털이 평가 대상이 되는 데이터 전종류를 포괄하지 못했습니다. 그리고 두 포털 이외에 데이터를 제공하는 사이트가 5곳 이상으로 분산되어 있습니다. 이는 대부분의 광역자치단체에 해당하는 사항입니다. 또 같은 종류의 데이터라도 광역자치단체에 따라 데이터 분포 및 현황도 다른 것으로 나타났습니다. 따라서 종류별로 필요한 데이터를 찾기 위해서 이용자는 큰 혼란을 겪을 것으로 예상됩니다.

문제는 이처럼 각 종류별로 게시된 사이트가 다르다보니 형식이나 업데이트 주기 등의 여러 요소도 일관되지 않을 가능성이 크다는 것입니다. 또 같은 항목에 대해서도 자치단체끼리 다른 형태를 띠고 있는 경우가 많습니다. 그러다보니 사용자로서는 혼란이 커질 수 있고 필요한 각각의 데이터를 찾거나 활용하는 데 다소 많은 시간을 소요하게 됩니다.

또 미처 관련 사이트들을 다 탐색하지 못해 사용자에게 필요한 데이터가 실제로는 존재함에도 불구하고 이용하지 못하는 불상사가 일어날 가능성도 있습니다. 해당 사이트를 찾아도 필요한 특정 데이터를 찾는데는 데이터 포털에서의 검색을 통하는 것보다 시간이 걸리는 경우가 많습니다. 데이터 포털에 있는 정보들은 게시, 수정 시간이나 형식, 라이선스 표기 등이 비교적 잘 되어있기 때문입니다. 따라서 분산되어 있는 각종 데이터들을 단일 데이터 포털에 최대한 모으고 형식도 통일하는 작업이 시급하다고 판단됩니다.

 

2. 모든 시도가 공개하지 않은 기업 명부

모든 시·도가 공개하지 않은 기업 명부

모든 시·도가 공개하지 않은 기업 명부

위 사진은 공공데이터 포털에 존재하는 울산광역시 기업 명단 중 일부입니다. 마을기업 및 사회적 기업, 제조기업 등 대부분의 지자체가 일부 기업에 대한 명단은 공개한 상태였으나 모든 범위의 기업을 포괄하는 사례는 없었습니다. 평가 대상인 12가지 종류의 데이터 중 모든 시도가 0점을 맞은 데이터가 기업 명부 데이터였습니다.

 

3. 대부분의 도에서 일괄 구축되지 않은 버스 정보

대부분의 도에서 일괄 구축되지 않은 버스 정보

대부분의 도에서 일괄 구축되지 않은 버스 정보

또 하나 확실한 경향성을 띠는 사항은 위의 사진들처럼 광역시들은 버스 정보 시스템을 구축하고 대부분 오픈 api 형식으로 버스 도착 정보까지 공개한다는 것입니다. 반면 도의 경우 경기도나 제주도 정도를 제외하고는 일부 시, 군만 버스 정보 시스템을 구축하는데 그쳤습니다.

이는 도 내의 일부 낙후된 지역까지 제대로된 인프라를 구축하기 어려우므로 버스 정보 시스템의 일괄 구축이 되지 않고 있을 가능성이 큰 것으로 보여집니다. 버스 정보 시스템을 구축하고 데이터를 수집해서 공개하려면 각종 장비들이 필요한데, 일괄적으로 한번에 설치하기에는 비용 문제에 걸릴 수 있는 것입니다. 광역시와 도 간의 데이터 격차가 가장 현저하게 나타나는 부문이었습니다.

 


지금까지 본고를 통해 살펴본 것처럼 각 광역자치단체는 공공데이터 포털을 구축하고 여러 종류의 데이터를 업로드하며 공공데이터 개방을 위한 노력을 기울이고 있습니다. 그러나 개방한 데이터량은 점차 늘어나지만 기업이나 시민들이 자유롭게 데이터를 이용할 수 있도록 환경이나 품질을 관리하는 측면에서는 다소 아쉬운 모습을 보이고 있습니다.

공공데이터의 진정한 의의는 누구나 자유롭게 이용하면서 생활의 질을 향상시키는 수단이 될 수 있다는 데 있습니다.  이 같은 궁극적 목표를 위해서는 데이터 형식과 소스를 통합하고 데이터 업데이트 날짜나 형식, 라이센스 등에 대한 친절한 안내를 통해 사용자 친화적인 공공데이터를 구축해나가야할 것입니다.

– 2017-10-25 뉴스젤리 안정민

  • By 뉴스젤리  0 Comments   
  • 뉴스젤리, 데이터시각화, 데이터관리, 공공데이터개방, 공공데이터품질, 데이터평가, 데이터지수, 지자체별공공데이터
  • 0 Comments

    Leave a Reply

    이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.

    two × two =