기상 데이터를 활용한 시각적 분석 사례
올 여름 유난히도 많이 내린 비 덕분에, 우산을 쓰는 날이 많았는데요! 혹시 지난 8월 이런 기사 한 번쯤 보신적 있지 않으신가요?
’52일간 이어진 역대 최장기 장마’, ‘사상초유 700mm 비왔다’ 등의 기사들을 보고 있자니, 문득 “그간 도대체 어땠길래?”라는 생각이 들었습니다. 과거에 얼마나 내렸길래 올해를 ‘사상 초유’, ‘역대급’이라고 표현하는지 궁금했어요! 또 한편으로는 내가 바라보는 창문 밖의 내리는 비는 흘러가면 그만이지만, 사실 한 번도 얼마나 많은지는 가늠해 보려고 하지 않았구나!하는 생각도 들었답니다. 그래서 이번 기회로 장마 데이터를 살펴보기로 했습니다.
# 데이터가 궁금하다면, 데이터를 찾아야지! : 데이터 수집하기
장마 데이터를 찾기 위해서 가장 먼저 기상청 사이트인 날씨누리에 접속했습니다. 아쉽게도 이 사이트에서는 과거 데이터를 확인할 수 없어서, 여기저기 헤매다가 기상자료개방포털 사이트에서 데이터를 수집했습니다…!
데이터를 한 군데 모아둔 사이트였기 때문에, 데이터 개방 포털에서는 비교적 쉽게 데이터를 찾을 수 있었는데요! 아쉽게도 어떤 경우에는 데이터를 개별 파일로 다운로드 한 뒤 하나로 합쳐야 하는 과정이 생겨서 불편하게 느껴진 부분도 있었습니다. (잠깐! 기상자료개방포털에서는 데이터와 함께 바로 확인할 수 있는 시각화도 게재되어 있으니 관심있으신 분은 사이트에 접속해보셔도 좋을 것 같습니다!)
# 데이터의 의미는 시각화로! : 시각적 분석하기
이제, 데이터 시각화로 궁금증을 해결해 볼 까요? 가장 먼저 장마일수의 변화를 알아보겠습니다!
중부, 남부, 제주의 연도별 장마 일수를 시각화한 라인 차트의 오른쪽 끝을 봐주세요! 중부와 제주는 지난 1974년 이후 올해 최대 일수를 기록했습니다. 특히, 중부의 경우 올해 처음으로 50일을 넘겨, 기록적인 해로 기억될 것 같습니다.장마일수가 가장 적었던 때는 언제일까?하는 궁금증도 들었는데요! 라인 차트의 가장 왼쪽인 지난 1973년의 데이터를 보면, 중부와 남부는 6일, 제주는 7일로 최근까지의 데이터를 통틀어 살펴보니, 이상치로 오해할 수 있을만큼 매우 적은 일수를 기록한 점이 놀라웠습니다.
한편, 장마 기간이라고 해서 매일 같이 비가 내리지는 않는다는 점 알고 계신가요? 이번에는, 역대급 마른 장마를 데이터로 찾아보도록 하겠습니다.
장마기간 중 강수일수가 차지하는 비중을 시각화한 위 히트맵을 보겠습니다. 중앙의 가장 옆은 열을 찾아보세요! 전국 각 지점마다 1999년 지점의 색이 가장 옅은 것을 볼 수 있습니다. 역대급 마른 장마는 1999년이었네요!
마지막으로 기록적인 비가 내렸던, 올해 전국 각 지점별 강수량을 살펴보겠습니다! 뉴스를 통해 각지에서 발생하는 피해 상황을 전해듣기는 했지만, 정확히 어느 지역에서 가장 비가 많이 내렸는지는 알기 어려웠는데요! 시각화로 답을 찾아보죠!
올해 장마기간 중 가장 많은 누적 강수량을 기록한 곳은 강원도 철원(1,085.4mm)입니다. 상위 10위권 내 부산을 제외하고서는 모두 중부 지방에 속했는데요! 상위 5개 지역 모두 1,000mm가 넘었네요! 1m에 이르는 높이만큼 비가 왔다니 정말 많은 비가 내렸네요!
또 일일 강수량이 가장 많았던 곳을 찾아보면 8월 2일의 충북 제천입니다. 하루 동안 259mm의 비가 내렸는데요! 누적 강수량 10위권에는 들지 못한 지역이지만, 일일 강수량으로는 최고 기록에 해당합니다. 2, 3위 경우 강원도 강릉 지역(강릉 250mm, 북강릉 217mm)이었습니다. (위 히트맵은 블로그 화면의 제약상 큰 이미지를 넣을 수 없어, x축(날짜), y축(지역)을 제외하고 시각화 패턴만 보여드렸는데요..! 좀 더 시각적 탐색을 해보고 싶으신 분은 큰 이미지를 볼 수 있는 링크를 클릭해 시각적 패턴을 찾아보세요!)
# 기상 데이터를 활용한 시각화, 그리고 인사이트
지금까지 기상 데이터 중 장마 데이터를 활용해 궁금증의 답을 찾아보았습니다. 그 과정을 다시 한 번 떠올려보면, 가장 먼저 궁금증을 정리하고, 이에 대한 답을 찾을 수 있는 데이터가 무엇인지 정의했습니다. 그리고 필요한 데이터를 찾아서 수집했습니다. 수집한 데이터가 원하는 형태가 아닐 경우에는 데이터 정제를 했습니다. 그리고 시각화 차트를 그려보고, 차트의 시각적 패턴을 근거로 데이터의 의미를 찾아보았습니다. 데이터의 의미는 곧 궁금증에 대한 답이 되어주었는데요! 이처럼 내가 필요로 하는 데이터를 정의하고, 수집하고, 시각화를 활용해 인사이트를 찾는 과정은 짧게 말해 “시각적 분석”의 과정으로 이야기 할 수 있는데요! 시각화를 활용하면 어렵고 막막하게 느껴지는 데이터 분석도 비교적 쉽게 접근해 자유롭게 데이터를 탐색하고 의미를 찾을 수 있습니다.
이번 글의 짧은 사례가 시각적 분석의 모든 것을 이야기 할 수는 없지만, 간단한 사례만으로도 시각적 분석이 왜 필요하고, 어떤 역할을 하는지 이해할 수 있는데요. 여러분도 자그마한 궁금증이라도 데이터 시각화를 통해 답을 찾는 시각적 분석의 과정을 시도해보시면 어떨까요?
BY. 브랜드마케팅팀 강원양