이상해 보이는 지도 시각화, 카토그램 A to Z
혹시 카토그램(Cartogram)이라는 단어를 들어보셨나요? 선거 개표 결과를 관심 있게 본 분이라면 한 번쯤 본 적이 있을 것 같은데요, 오늘은 제8회 전국동시지방선거를 앞두고 언론을 통해 자주 접하게 될 지도 시각화 유형, 카토그램(Cartogram)에 관해 알아보겠습니다. 카토그램은 앞으로 선거 때마다 보게 될 테니 관심 있게 봐주셨으면 좋겠어요!
카토그램이란 무엇일까요?
카토그램은 특정한 데이터 값에 따라 모양을 변형하여 만든 지도 시각화를 말합니다. 보통 지도는 행정구역과 지리적 위치에 따라 제작하는데요, 카토그램은 강우량, 인구분포 등 정량적인 데이터를 기준으로 영역이나 거리를 조정하여 공간을 왜곡합니다.
위에 보이는 것처럼 우리가 보통 사용하는 지도(왼쪽)는 면적이 넓은 강원도와 영남(경상남・북도) 지역이 많은 비율을 차지합니다. 하지만 우리나라는 서울시, 경기도, 인천시를 포함하는 수도권에 50%가 넘는 인구가 거주(2020 기준, e-나라지표)하고 있어요. 따라서 인구수를 기준으로 카토그램(오른쪽)을 그리면 서울시와 경기도가 커지고 강원도와 충청북도가 납작해지는 어딘지 이상한 지도가 나타나게 되는 거죠. 이 경우 시각적으로 낯설어서 이상해 보이기는 하지만, 기존의 지역별 면적의 크기에 영향을 받지 않고, 어느 지역의 인구가 가장 많은지를 쉽게 볼 수 있다는 장점이 있습니다.
물론, 인구수 등 데이터에 따라 지도를 왜곡하는 카토그램을 만들 때에는 그 결과물을 사람들에게 공유할 때 왜곡의 기준이나 어떤 방식으로 시각화를 했는지 등을 충분히 설명해서 보는 사람이 쉽게 이해할 수 있도록 해야합니다.
생김새는 달라도 카토그램이에요!
카토그램도 구체적인 생김새에 따라 여러 종류가 있습니다. 신문・방송 등 우리나라 언론 매체에서 볼 수 있는 두 가지 종류의 카토그램, 연속 카토그램(Contiguous Cartogram)과 격자무늬 카토그램(Gridded Cartogram)을 살펴보겠습니다.
# 연속 카토그램
아래에 보이는 두 개의 지도 시각화는 제19대 대통령 선거 결과를 나타낸 차트인데요, 왼쪽은 시군구 경계를 사용하여 컬러로 데이터를 구분한 단계구분도(Choropleth Map), 오른쪽은 선거인 수 데이터를 기준으로 변형한 연속 카토그램이라고 합니다.
연속 카토그램은 데이터가 크면 면적도 크게 나타납니다. 유권자 수를 기준으로 제작한 위의 시각화를 보면 유권자 수가 많은 서울시, 경기도, 인천시 지역이 지도의 절반을 차지할 정도로 커지고 유권자 수가 적은 강원도 지역은 납작해졌습니다.
지역 지도(왼쪽)를 보았을 땐 문재인, 홍준표가 비슷하게 득표한 것처럼 보이지만 연속 카토그램(오른쪽)을 보면 대구시, 경상북도, 강원도 지역을 제외하고 대부분 지역에서 문재인이 더 많은 표를 받았다는 사실을 확인할 수 있는 거죠.
연속 카토그램은 데이터에 따라 기존의 지도 모양이 크게 달라지며 기존 지역의 면적이나 경계를 구분하기 어려울 수 있다는 한계가 있지만 실제 행정구역의 경계와 인접성을 유지하며 데이터의 의미를 나타낸다는 장점이 있어요.
# 격자무늬 카토그램
다음 유형도 살펴볼까요? 제20대 국회의원 선거의 선거구별 당선 현황을 나타낸 지도 시각화인데, 왼쪽과 오른쪽 시각화의 차이가 느껴지시나요? 왼쪽은 격자무늬 카토그램, 오른쪽은 컬러로 구분한 단계구분도입니다.
격자무늬 카토그램은 연속 카토그램과 달리 지리적 위치와 관계없이 일정한 기준에 따라 사각형, 육각형, 원형 등 동일한 크기의 모양으로 표현하는 데이터 시각화 유형입니다. 위의 이미지를 예로 들면 하나의 사각형은 한 곳의 선거구를 나타내며, 지역의 인접성을 기준으로 나열하기는 하지만, 그렇지 않다고 해도 문제가 되지 않습니다. 도형을 순차적으로 나열하다 보면 어쩔 수 없이 지역적 위치가 바뀌는 경우가 발생하기 때문이죠!
단계구분도(오른쪽)를 보면 새누리당(빨간색)이 대부분의 선거구에서 당선된 것처럼 보이는데요, 격자무늬 카토그램(왼쪽)을 보면 더불어민주당과 새누리당의 의석 수가 비슷한 것을 인지할 수 있습니다.
최근 선거에 사용된 카토그램을 톺아볼까요?
이처럼 카토그램은 인구 비례를 반영한 선거 결과를 명확하게 보여주기 때문에 점점 더 많이 활용하는 추세입니다. 최근 치러진 선거에서는 어떤 카토그램을 사용했을까요? 아무래도 연속 카토그램은 우리가 기존에 알고 있는 지도의 모양과 많이 달라져 알아보기 힘들고 격자무늬 카토그램에 비해 해석하기 어렵다고 느끼기 때문일까요? 언론에서는 대부분 격자무늬 카토그램을 사용하고 있었어요.
# 제21대 국회의원 선거, 격자무늬 카토그램으로 보는 지역구별 당선 현황
2020년 4월 15일 치러진 제21대 국회의원 선거 이후 당선 현황을 표시한 격자무늬 카토그램입니다. 경기도와 서울시가 크게 표현되고 강원도가 작아졌죠? 사각형 하나가 한 곳의 선거구를 의미하기 때문입니다.
위 카토그램에서 시도 경계를 기준으로 검은색 라인의 테두리를 볼 수 있는데요! 각 시도의 면적을 비교해 보면 경기도(59곳)의 선거구가 가장 많고 그 다음은 서울시(49곳), 부산시(18곳) 순임을 알 수 있습니다. 두 번째로 많은 곳인 서울시(49곳)와 세 번째로 많은 곳 부산(18곳)(부산시)의 차이가 상당한 걸 보니 수도권에 인구가 얼마나 많은지 알 수 있네요. 세종시(2곳)가 가장 적고 인구가 적은 강원도, 경상남도, 전라남도 등은 여러 지역을 묶어서 하나의 선거구로 만들었습니다. (참고로 국회의원 선거구는 인구, 행정 구역, 교통 등의 조건을 고려하여 나눕니다)
전국을 기준으로 보면 더불어민주당이 미래통합당에 비해 거의 2배가량 많이 당선 되었습니다. 또한, 소수이지만 정의당, 무소속 출신의 국회의원이 당선된 지역구 역시 확인할 수 있습니다. 이는 모든 선거구를 동일한 크기의 사각형으로 표현했기 때문에 정확하게 알 수 있는 정보입니다.
이와 더불어 우측 상단에 정당별 당선자 수를 막대 차트로 요약해 주어, 어느 당이 몇 개의 의석을 차지 했는지 바로 확인할 수 있도록 한 점도 눈에 띕니다. 지도 위의 각 색깔별 면적을 비교했을 때 대략적인 판세를 알 수 있다면, 정확한 수치는 막대 차트에서 확인할 수 있도록 해 개별 시각화의 한계를 보완했습니다.
# 20대 대통령 선거, 후보 간 득표율 격차를 시각화 한 카토그램
2022년 3월 9일 진행한 20대 대통령 선거의 득표 결과를 나타낸 격자무늬 카토그램인데요, 앞서 본 카토그램의 경우 지역별 당선인 혹은 최다 득표율을 기록한 후보자의 정당 컬러 1가지를 지도에 표현했다면, 이번 시각화는 후보 간의 득표율 격차에 따라 컬러를 그라데이션으로 활용했습니다. 특정 정당의 후보가 이기긴 했지만, 그 격차가 컸는지 아니면 근소한 차이였는지를 확인할 수 있습니다.
윤석열을 지지한 표는 빨간색으로 이재명을 지지한 표는 파란색으로 표시하되 득표율 격차가 적을수록 연한 색으로 표시하여 각 지역별 데이터를 한눈에 파악할 수 있습니다.
단순하게 ‘경기도 안양시, 안산시, 부천시, 수원시에서 이재명이 더 많은 지지를 얻었구나’가 아니라 ‘경기도 부천시, 안산시는 진한 파란색인 걸로 보아 득표율 격차가 10%p 이상이고 안양시, 수원시는 1~4%p 미만이구나, 네 곳 모두 이재명을 더 많이 지지하긴 했지만 부천시와 안산시의 지지율이 더 높았구나’라는 사실을 알 수 있는 것이죠.
위 카토그램에서 육각형 하나는 시군구를 의미하는데요! 대통령 선거의 선거구는 전국이므로 지역별 민심을 알아보기 위해 시군구까지만 표시했습니다. 시각화 하단에 ‘한 칸당 유권자 15만 명을 기준으로 나눴다’는 카토그램을 제작할 때 세운 명확한 기준을 안내한 점은 인상적입니다. 육각형 하나가 무엇을 의미하는지 확실하게 알 수 있어 데이터의 의미를 이해하기도 수월했어요!
얼핏 보면 헷갈리는 카토그램, 잘 살펴봐야 해요!
카토그램이 지리적 위치와 면적에 따라 데이터를 표기라는 지도 시각화(단계구분도)의 약점을 보완한 데이터 시각화 유형이기는 하나 제작하기 까다로운 만큼 주의가 필요합니다. 기준에 따라 일관성 있게 제작하지 않으면 잘못된 정보를 전할 수 있거든요.
# 카토그램 제작 기준을 표기하세요!
다음은 2018년 6월 13일 치른 제7회 전국동시지방선거의 출구조사 결과를 시각화한 격자무늬 카토그램입니다. 그냥 보면 더불어민주당은 파란색, 자유한국당은 빨간색, 무소속은 회색으로 나타낸 일반적인 카토그램이라고 생각할 수 있는데요! 여기에 함정이 있습니다.
위의 카토그램을 보면 육각형 하나가 무엇을 의미하는지 정확히 알기 어렵습니다. 기준이 면적이라면 서울시(605.23㎢)가 제주도(1,833.2㎢) 보다 크면 안 되고, 당시 중앙선거관리위원회가 집계한 선거인 수를 기준으로 카토그램을 제작했다면 인천시(2,440,779명)와 제주도(532,515명)의 크기가 더 큰 차이를 보여야 합니다. 세종시는 바로 옆의 대전시와 크기가 비슷해 보이는데요, 선거인 수를 비교하면 세종시는 20,766명이고 대전시는 117,689명으로 차이가 큽니다.
이와 같이 어떤 기준으로 카토그램을 제작했는지 알 수가 없기 때문에 전체 데이터 시각화의 신뢰도도 떨어집니다. 해당 지역의 데이터를 강조하기 위해 의도적으로 왜곡을 더했을 수 있기 때문이죠. 카토그램의 제작 기준을 명시하면 사용자의 이해를 돕고 전체 데이터 시각화의 신뢰도도 높일 수 있습니다.
# 카토그램에서도 범례를 잊지 마세요!
아래 이미지는 2020년 4월 15일 치러진 제21대 국회의원 선거의 여론조사 결과를 나타낸 격자무늬 카토그램이에요. 인터랙티브 요소를 활용하여 사용자가 직접 데이터를 탐색하고 풍부한 인사이트를 얻을 수 있도록 설계한 부분이 인상적입니다.
앞서 언급한 다른 카토그램은 1등 후보의 데이터만 보여주어 해당 지역에서 다른 후보를 선택한 비율이 얼마나 되는지는 알 수 없었어요. 하지만 이 격자무늬 카토그램은 각 지역별로 툴팁에 상세 정보와 막대를 넣어 더 많은 정보를 제공하고 있습니다.
다만 범례를 제공하지 않아 각 컬러가 무엇을 의미하는지 직관적으로 알기 어렵습니다. 국회의원 선거를 주제로 한 데이터 시각화니까 경험적으로 파란색은 더불어민주당, 빨간색은 미래통합당, 노란색은 정의당, 회색은 무소속이라는 것을 알 수 있겠지만요.
사용자의 이해도를 높일 수 있도록 범례를 추가하여 이 차트가 어떤 내용을 나타내고 있는지 표시해 주면 데이터 시각화를 사용하는 목적이 분명해지지 않을까요?
에디터의 한마디
단계구분도를 비롯한 일반적인 지도 시각화의 한계를 보완하기 위해 카토그램을 사용하지만 이 역시 완벽할 수는 없습니다. 인구수에 비례하여 지도의 면적이 달라지는 카토그램에서 선거 결과에 따른 민심을 비교적 정확하게 알 수 있지만, 면적마다 가장 높은 비율로 당선된 정당의 컬러만 표기한다면, 1등 이외에 다른 후보를 선택한 표심까지는 나타낼 수 없다는 한계가 그대로 존재합니다. 즉, 이는 카토그램을 통해 데이터의 의미를 전달하지만, 데이터의 의미를 추가로 전달할 수 있는 다른 시각화의 활용도 적극 고려해 봐야 한다는 것을 의미합니다.
마지막으로 외국의 사례를 하나 소개하며 글을 마무리하겠습니다. 2020년 11월 치러진 미국의 대통령 선거 결과를 시각화한 뉴욕타임즈 기사 ‘Presidential Election Results: Biden Wins’인데요, 다양한 관점에서 선거 결과를 볼 수 있도록 지역 지도, 격자무늬 카토그램, 도형표현도(Simbol Map), 화살표 지도까지 총 네 가지 유형의 시각화를 제시하고 있습니다.
하나의 차트가 완벽한 정보를 제공하기에는 한계가 있는 만큼, 우리나라에서도 여러 유형을 제공하여 사용자가 필요에 따라 다양한 인사이트를 얻을 수 있었으면 합니다.
카토그램은 이번 제8회 전국동시지방선거 뿐만아니라 앞으로 치러질 선거 때마다 자주 등장할 예정이니 이번 글을 통해 친숙해지는 계기가 되었으면 좋겠다는 바람을 전해봅니다.
*참고
– CV-32 – Cartograms, GIS&T Body of Knowledge
– 츄리닝맨, “카토그램으로 다시 보는 ‘진짜’ 19대 대선 지도”, slownews, 2017. 05. 18.
– 김태형, “총선⑫ 인구 비례로 본 당선 지도…‘카토그램’으로 살펴본 당선 현황”, KBS, 2016. 04. 14.
– 안지혜, “[그래픽][21대 총선]카토그램으로 보는 전국 선거구별 정당 현황 (개표완료)”, 뉴시스, 2020. 04. 16.
– 김은지, “‘0.73’ 차기 대통령이 새겨야 할 숫자”, 시사IN, 2022. 03. 16.
– 이정환, [속보] 출구 조사, 광역 14 대 3 민주당 ‘압승’… 재보선도 12곳 중 10곳 우세, 오마이뉴스, 2018. 06. 13.
– 이종호, [여론조사로 본 총선 판세] 민주 97.5 : 통합 54.5 : 정의 1 : 무소속 4, 오마이뉴스, 2020. 03. 25.
– 배세영, 곽성은 and 윤재영. (2017). 선거 카토그램의 왜곡정도에 따른 이해도와 선호도 조사. 디자인융복합연구(구.인포디자인이슈), 16(6), 29-42.
Editor. 귤젤리