데이터 시각화 활용팁
4차 산업혁명과 함께 전 세계가 주목 하는 것, 바로 ‘공공데이터’ 입니다.
‘공공데이터’란 공공기관이 만들어 내는 모든 자료나 정보, 그리고 국민 모두의 소통과 협력을 이끌어 내는 공적인 정보를 말합니다. 공공 부문 데이터 공개는 정부 투명성을 높이고 국민의 알 권리를 향상하며 시간과 자원을 절감하는 효과가 있습니다. 정부 데이터 공개 정책은 빅데이터 시대에 소통과 공유, 협업 전략이 무엇보다 중요하다는 것을 의미합니다.
우리나라는 어떻게 공공데이터를 이용하고 있을까?
대표적으로 공공데이터포털(DATA.GO.KR) 운영 입니다.
우리나라는 공공데이터 촉진을 위해 공공데이터 포털을 운영해서 국민과의 소통을 이뤄내고 있습니다. 각 공공기관이 보유한 데이터 목록과 국민에게 개방할 수 있는 데이터를 공공데이터 포털에 등록을 하면 모든 국민이 데이터를 이용할 수 있습니다. 공공데이터 포털에 들어가면 종류별, 내용별 많은 공공데이터를 검색할 수 있습니다. 혹시라도 개방된 데이터 외에 자신이 필요한 데이터가 있다면 별도로 신청을 통해 검토 후 데이터를 받을 수도 있습니다.
국민들이 필요한 데이터를 모은 국가중점 데이터
정부는 단순히 성과를 위해서 공공데이터를 개방하는 것이 아니라 국민, 기업 등 수요중심으로 개방의 효과성, 시급성 등이 높은 분야를 선정하고, 민간에서 활용하기 쉬운 형태로 가공하여 데이터를 개방했습니다. 이것이 바로 ‘국가중점 데이터‘ 입니다.
‘국가중점 데이터’ 는 36개의 다양한 분야를 설정해서 부동산, 상권, 국민건강, 농축산가격 등 국민 생활과 밀접한 분야를 우선 적으로 추진을 해왔습니다. 2017년까지 20개 정도의 분야의 데이터를 개방해 왔고 2018년 1월에 4차 산업혁명 신산업분야의 핵심데이터(이하 국가 중심데이터) 15개 분야의 공공데이터를 개방 완료했습니다.
그렇다면 국가중점 데이터 는 과연 어떤것들이 있을까요 ? 국민들이 관심있게 사용하는 데이터 4가지를 소개하도록 하겠습니다.
1.“내가 출근하는 길이 안전할까 ?” 교통사고 통계 – 경찰청
내가 자주 이용하는 도로의 교통사고는 얼마나 자주 일어나고 있을까? 우리나라는 OECD 회원국 중 교통사고 발생 순위가 1, 2위를 다툴 정도로 교통사고가 자주 일어나는데요. 그만큼 국민들이 교통사고에 대한 관심을 많이 가지다 보니 공공데이터가 오픈되고 나서부터 현재까지 가장 많은 사랑을 받고 있는 데이터입니다.
도로교통공단은 경찰청으로부터 수신된 사고 약도, 위치 등의 데이터들을 정제하여 별도의 분석시스템을 거쳐 공공데이터 포탈 및 온라인채널을 통해 서비스를 제공합니다. 지도를 통해서 지역별, 노선별 사고다발지 검색도 가능하고 세부적인 사고내용, 사고유형 다양한 설정을 통해 데이터를 알아볼 수 있는 유용한 공공데이터입니다.
2. “오늘 하루 내가 먹은 음식의 칼로리는 얼마일까?” 식품영양 ·기능정보 – 농촌진흥청
나는 오늘 충분한 영양소를 제대로 섭취했을까? 많은 궁금증이 드는데요. 어떤 음식을 먹느냐에 따라서 건강을 좌우하다 보니 많은 국민들이 식품을 선택하는 데 영양 정보를 많이 알아보는데요. 농촌진흥청에서 제공하는 농식품종합정보시스템을 통해서 자신이 먹은 음식의 영양소를 세부적으로 검색할 수 있고 영양가를 따로 계산할 수 있습니다. 또한, 소비자 맞춤형 식품성분표를 통해서 연령대별 영양 길잡이를 통해 모든 국민이 건강한 상차림을 할 수 있도록 도움을 주고 있습니다.
3.”지진 나면 어디로 대피해야 될까 ?” 지진대피소정보 – 행정안전부
지진이 나면 우리 동네 어디로 대피를 해야 할까요? 최근까지도 경상북도 포항 근처에서 여진이 발생해서 우리나라는 이제 지진 안전지대라는 말이 무색할 정도입니다. 이제는 우리 스스로 지진에 대해서 대비를 하고 대피소 정보를 습득해야 합니다 이를 위해 행정안전부는 평상시 모든 국민들이 생활 주변 지진대피소를 인지 할 수 있도록 국민 재난 안전포털 등 다양한 매체를 통해 대피소 위치 정보를 제공하고 있습니다. 이러한 지진대피소 정보는 공공데이터 포털을 통해 오픈 API와 파일 형태로 개방되어 누구나 대피소의 정보를 쉽게 접할 수 있습니다.
4. “바다의 정보를 쉽게 알 수 없을까?” 해양공간정보 – 해양수산부
해양공간정보는 ‘바다’의 시간에 따른 역동적인 변화를 공간위에 담아낸 모든 정보를 의미합니다. 가장 기본적인 수심과 해상구역 정보에서 부터 다양한 레저, 관광 정보까지 모두 포함되어 있습니다. 낚시를 좋아하는 분들이라면물때에 맞춰 나가기 위해 일기예보를 챙겨보거나 인터넷 검색을 통해서 조류시간과 날씨를 확인하곤 합니다. 하지만 이제는 국립해양조사원이 제공하는 ‘개방海’ 를 통해 실시간 바다 정보 및 낚시에 필요한 모든 정보를 시각화를 통해 좀 더 쉽고 직관적으로 알 수 있게 되었네요.
이렇게 정부에서 다양한 데이터를 개방한 덕분에 국민들이 정보를 쉽게 접할 수 있는데요. 하지만 공공데이터양이 너무 많다 보니 자신이 필요한 정보만 찾기에는 많은 시간이 소요가 되고 있습니다. 그렇다면 이 많은 데이터 중에서 자신이 원하는 데이터만 시각화로 나타낸다면 어떨까요? 위의 중점데이터 중 하나를 예시로 데이터를 시각화를 해보았습니다.
DAISY 활용해 공공데이터를 시각화로 만들기
예시를 들기위해서 위의 중점데이터 중 최근에 가장 관심이 많은 지진대피소 정보 데이터를 선정해 보았습니다.
1) 자신이 원하는 데이터를 찾아서 다운받기 (csv 파일)
ex) 지진이 잦은 포항,경주 지역 대피소 공공데이터를 다운 받았습니다.
2) 다운받은 데이터를 DAISY 와 연동을 통한 시각화 만들기
DAISY 홈페이지를 들어갑니다. 그리고 오른쪽 위에 시각화 만들기를 누르고 내려받은 데이터를 올리면 시각화 추천 창에 해당 데이터가 자동으로 연동이 됩니다. 이렇게 DAISY에서 데이터를 불러오기만 하면 DAISY가 해당 데이터 구조 등을 자동으로 인식하고, 데이터를 자동 정제하여 시각화를 위해 데이터를 번거롭게 편집할 수고를 덜 수 있습니다.
3) 추천 시각화를 통해 원하는 차트 선택 후 바로 활용
데이터를 시각화하려면 사실 데이터를 편집하는 작업 외에도, 데이터의 구조에 맞는 어떤 시각화 유형을 선택해야 할 지 고민이 되기 마련인데요. DAISY에서는 사용자가 원하는 필드 목록을 선택하면 다양한 시각화 추천 유형이 자동으로 생성이 됩니다. 제가 선택한 내용은 지진대피소이기에 다른 차트보다는 MAP Chart 을 선택해서 활용하기로 했습니다.
4) 완성된 ‘경주.포항 지진대피소’ 시각화 차트
용량이 크거나 복잡한 데이터라 할지라도 DAISY를 활용한다면 정말 쉽게 시각화로 표현할 수 있죠? DAISY의 21종 이상의 차트라이브러리, 자동 정제 및 추출 기능, 자동으로 최적화된 시각화유형을 추천해주는 기능을 통해서 국민 누구나 쉽게 공공데이터를 이용할 수 있습니다.
이 외에도 DAISY 홈페이지에서도 공공데이터 포털에 있는 공공데이터를 검색을 통해 다운을 받지 않고 바로 다양한 데이터를 바로 시각화를 할 수도 있고 내가 만든 시각화 그래프뿐만 아니라 다른 시민들이 직접 만든 그래프를 통해서 인사이트를 얻을 수도 있습니다. 정말 굉장하죠?
지금까지 공공데이터를 소개하고 활용하는 법을 소개했는데요. 옛말 중에 “구슬이 서 말이라도 꿰어야 보배”라는 말이 있는데요. 아무리 좋은 것이라도 쓸모 있게 만들어 놓아야 값어치가 있다는 뜻입니다. 저 속담처럼 공공데이터 또한 똑같다고 봅니다. 아무리 공공데이터가 많이 개방되었다고 해도 데이터 활용이 복잡하거나 어떻게 활용해야 할지 여전히 막막하게 느껴진다면 빛 좋은 개살구에 지나지 않겠죠? 이글을 통해 좀 더 많은 분이 공공데이터를 효과적으로 활용할 수 있게 되기를 기대해봅니다.
By 사업개발팀 함명훈