공공데이터를 활용하여 새해 계획 실천 여부를 확인해보았습니다!
새해를 맞아 새로이 계획한 각종 결심들! 지난 <데이터 시각화로 알아보는 새해 목표에 관한 모든 것>에서 데이터를 탐색하여 확인한 결과, 사람들의 새해 계획에는 ‘건강’, ‘다이어트’, ‘운동’ 등의 키워드가 반복적으로 나타나 ‘건강관리’에 관심이 많다는 사실을 알 수 있었습니다.
어느덧 1월이 끝나가는 시점인데요, 잘 지키고 계신가요? 이번 콘텐츠에서는 새해에 계획이나 목표를 세우는 데 그치는지, 아니면 실천을 하는지 공공데이터를 활용하여 파헤쳐보고자 합니다!
공공데이터로 계획 실천 여부를 알 수 있을까요?
‘계획을 실천하고 있다’는 것은 어떤 공공데이터로 확인할 수 있을까요? 공공데이터는 ‘공공기관이 생성하거나 관리하는 자료 또는 정보’를 이야기하는데요, 이때 ‘공공’이라는 단어가 ‘국가나 사회의 구성원에게 두루 관계되는 것’을 의미하는 만큼, 검색만으로도 확인할 수 있는 오픈데이터, 개방형데이터도 넓은 범위에서 공공데이터라고 볼 수 있지 않을까요? 그래서, 이번 콘텐츠에서는 누구나 쉽게 볼 수 있는 네이버 데이터랩을 활용하여 데이터를 분석해보았습니다.
1. ‘추천운동’ 검색량 데이터로 계획 실천 여부를 확인해보아요!
‘운동을 해야겠다’고 마음먹은 다음, 어떤 행동을 하시나요? 평소 즐기는 운동이 없다면 적당한 운동을 찾기 위해 ‘추천운동’을 검색해볼 것 같아요. 검색을 통해 마음에 드는 운동을 찾고 이러한 행동이 곧 실천하는 것이라고 생각해요.
하단의 이미지는 네이버 데이터랩의 ‘추천운동’ 검색량 데이터를 분석하여 시각화한 라인차트입니다. 2016년부터 2021년까지 전 연령, 성별을 대상으로 한 데이터이고 조회기간 내 최다 검색량을 100으로 보고 상대적인 수치를 나타냅니다. 컬러가 짙을수록 현재의 연도를 의미합니다.
라인차트를 보면 2016년부터 2021년까지 6개의 수치 중 2019년과 2021년을 제외하고 모두 1월의 검색량이 가장 높게 나타납니다. 2021년을 제외하고는 모두 95 이상의 높은 수치를 보이고요.
그렇다면 2021년에는 무슨 일이 있었던 걸까요? 이러한 결과는 2020년 11월부터 시작되어 이듬해 1월까지 이어진 대한민국의 코로나19 3차 대유행으로 인해 운동 수요가 줄어든 것으로 예상됩니다. 아래 시각화에서 레이블이 보이는 세 지점이 코로나19 3차 대유행 시기예요.
이 당시 처음 4자리 수 확진자가 발생하기도 했고, 코로나 사태가 시작된 이래 최악의 대규모 유행이 되었어요. 2020년 12월에도 급격히 하락하는 모습이 보이죠? 그래서 2021년 1월의 결과도 다른 해와 다르게 나타난 것이라고 추측할 수 있습니다.
연령별로 비교해보면 어떨까요? 아래 데이터 시각화는 ‘추천운동’의 검색량을 연령별로 나눈 영역차트인데요, 컬러가 짙은 파란색으로 나타날수록 현재에 가깝습니다.
2016년에서 2020년까지 전체적으로 1월의 검색량이 가장 높게 나타납니다. 61세 이상 그룹을 제외하고요. 다만, 2021년 1월에는 낮은 검색량을 보이는데요, 앞서 언급했던 것처럼 코로나19 대유행의 영향이 아닐까 생각해봅니다.
‘추천운동’의 검색량 데이터를 분석한 결과, 연령이나 시기에 따라 약간의 차이를 보이기는 하나 종합적으로 보면 1월의 검색량이 높다는 사실을 확인할 수 있었습니다. 이로써 새해에 운동을 실천하고자 하는 사람이 많다는 사실을 미루어 짐작할 수 있었어요.
2. 운동장소 관련 검색량 데이터로 계획 실천 여부를 확인해보아요!
운동을 실천하는 사람들을 또 어떤 공공데이터로 파악할 수 있을까요? ‘추천운동’을 통해 종목을 선정했으니 이제 장소를 찾지 않을까요? 문화체육관광부의 2021년 국민생활체육조사에 따르면 규칙적으로 체육활동을 하는 사람들은 ‘걷기’, ‘등산’, ‘보디빌딩’, ‘요가’, ‘필라테스’ 등을 주로 한다고 합니다.
주로 야외에서 할 것이라고 예상되는 ‘걷기’와 ‘등산’을 제외하고 ‘헬스장’, ‘요가학원’, ‘필라테스학원’의 검색량 데이터를 확인해보았습니다. 운동하러 갈 장소를 구체적으로 검색한다는 것은 그만큼 실천할 의지가 있다는 의미가 아닐까요?
‘요가학원’, ‘필라테스학원’, ‘헬스장’의 검색량 데이터를 영역차트로 시각화하였습니다. 가장 왼쪽에 위치한 ‘요가학원’ 차트를 보면, 1월에 비교적 높은 검색량을 보이고 특히 7월~9월에 더 많은 검색량이 나타납니다. 해마다 일정한 시각적 패턴이 나타나지는 않지만 2020년 1월부터 10월까지 유난히 낮은 검색량이 눈에 띕니다. 코로나19의 영향이라고 하기엔 ‘필라테스학원’과 ‘헬스장’의 검색량이 높은 편이라 의아했어요.
중간에 보이는 ‘필라테스학원’의 차트를 살펴볼까요? 전체적으로 5월~7월에 검색량이 많고, 2018년부터는 1월의 검색량이 높게 나타납니다. 특히 코로나19 시기인 2020년과 2021년의 검색량이 전체적으로 두드러지네요. 필라테스는 소수 인원으로 진행하는 경우가 많다 보니 코로나19의 영향을 덜 받은 것일까요?
가장 오른쪽이 ‘헬스장’ 데이터를 시각화한 영역차트인데요, 2016년부터 2018년까지 1월과 7월, 12월 등의 검색량이 높게 나타나는, 대체로 비슷한 시각적 패턴을 보입니다. 1월과 12월은 새로운 계획을 세우는 연말연시라서, 7월은 옷차림이 본격적으로 가벼워지는 여름이라 관심도가 높게 나타난 것 같아요.
2020년과 2021년은 코로나19의 영향인지 예년보다 ‘헬스장’의 검색량이 줄어들었습니다. 특히 2021년 2월 이후 검색량이 현저히 줄어든 모습이 보이는데요, 이용시간이 9시로 줄어들고, 샤워시설을 이용하지 못하는 등 강화된 사회적 거리두기로 인해 검색량도 줄어든 것으로 보입니다.
운동장소와 관련한 키워드를 분석결과를 종합해보면 2020년을 제외하고 대체로 1월의 검색량이 높게 나타나는 편이나, 여름철 검색량이 더 높은 것으로 보아 여름철 얇아지는 옷 때문에 이 시기에 운동하는 사람이 더 많은 것으로 짐작됩니다.
‘요가학원’, ‘필라테스학원’, ‘헬스장’의 데이터를 성별로도 나누어보았는데요! 파란색 라인은 남성, 오렌지색 라인은 여성의 데이터를 나타냅니다.
‘요가’와 ‘필라테스’라고 하면 왠지 여성이 더 많이 할 것 같은 운동이라고 생각되는데요! 그래서 ‘요가학원’과 ‘필라테스학원’을 검색하는 사람도 여성이 많을 거라고 예상했습니다. 검색량 데이터도 그럴지 자세히 살펴볼게요!
왼쪽에 있는 ‘요가학원’ 데이터를 시각화한 차트를 보면 2019년까지 남성의 검색량이 더 높게 나타났습니다. 2020년부터 여성의 검색량이 더 높아졌지만 큰 차이를 보이지는 않았고, 2021년 1월부터 차이가 벌어지기 시작해서 7월부터는 낮은 검색량을 보입니다.
이러한 추세는 ‘필라테스학원’과 관계가 있지 않을까 추측해보았는데요! ‘요가’와 ‘필라테스’가 코어를 강화하며 비교적 정적인 운동이기 때문에 같이 묶어서 생각하곤 하잖아요. 남성의 ‘필라테스학원’ 검색량이 증가하기 시작한 2021년 6월과 맞물려 ‘요가학원’의 검색량이 줄어들었어요. 송중기, 유준상, 김영광 등 여러 남자 연예인들도 필라테스를 즐긴다고 하니, 남성들의 관심사가 요가에서 필라테스로 바뀐 것은 아닐까요?
‘헬스장’은 남성과 여성 비슷한 시각적 패턴을 나타내는데, 남성의 검색량이 약간 앞서는 수준입니다. 2021년 2월 이후 검색량이 급격히 줄어든 것은 앞서 언급했던 것처럼 코로나19로 인한 사회적 거리두기 때문으로 보여요. 그렇지만 이 시기부터 꾸준하게 여성의 검색량이 높게 나타나는데요, 비록 코로나19로 인한 제약이 있으나 남성보다 여성이 헬스장에 관심이 높다는 것을 알 수 있습니다.
운동장소에 관한 검색량 분석 결과를 종합해보면 각 운동 장소별 전체적으로 1월 검색량이 월등히 높은 것은 아니지만, 매년 초 꾸준히 관심이 있음을 알 수 있습니다.
3. 카드사용통계 데이터로 계획 실천 여부를 확인해보아요!
검색량 말고 보다 더 직접적인 공공데이터는 없을까요? 홈트레이닝 수요가 늘었다고는 하지만, 강제성 없이 운동을 하기란 너무도 어려운 일인데요! 그래서 헬스장이나 요가학원 등을 등록하고 약간의 강제성을 부여하는 것이 아닐까요? 소비를 하면 조금 더 꾸준하게 실천할 가능성이 높다고 생각합니다. 그래서 생활체육공간에서 사용된 카드통계를 확인해보았습니다. 새해에 해당 업종의 카드 사용량이 높았다면 계획을 실천하고 있다고 볼 수 있겠죠.
위 데이터 시각화는 네이버 데이터랩에서 제공하는 카드사용통계 데이터를 가지고 제작한 것입니다. 서울특별시의 생활체육공간에서 사용한 비씨카드 결제 데이터를 토대로 제작하였으며, 최다 사용량을 100으로 보고 상대적인 수치를 나타냅니다.
가장 왼쪽의 회색 막대차트는 전체사용통계를 나타내고 중간의 파란색 막대차트는 남성의 사용통계를, 오른쪽의 오렌지색 막대차트는 여성의 사용통계를 나타냅니다. 차트를 보면 2월, 3월, 5월, 8월의 막대가 나타나지 않는데요! 원본 데이터를 살펴보면 해당 기간의 값이 0이라고 나와요. 그런데, 천만 명에 가까운 서울특별시 인구에서 정말 이 기간에 카드를 사용한 사람이 단 한 명도 없을까요? 그래서 0으로 표시하는 대신 아예 해당 값을 제외하고 시각화하였습니다.
앞서 ‘추천운동’과 ‘요가학원’, ‘필라테스학원’, ‘헬스장’ 등 검색량 데이터를 분석했을 때는 1월의 결과가 높게 나타났는데 카드사용통계는 다른 결과를 보입니다. 6월의 소비가 가장 많고, 10월, 12월 순입니다. 1월은 오히려 가장 낮은 수치를 기록했습니다. 성별로 나누어 보아도 큰 차이가 나타나지는 않네요.
연령별로 보면 혹시 차이가 있지 않을까요? 데이터 시각화로 확인해보도록 하겠습니다. 카드사용통계를 연령별로 구분하여 영역차트로 시각화한 차트예요. 앞서 언급했던 것처럼 2월, 3월, 5월, 8월의 데이터는 제외되어 있습니다.
가장 왼쪽의 20대 미만을 제외하고 전 연령이 비슷한 시각적 패턴을 보입니다. 다만, 1월에 차이가 뚜렷하게 나타나는데요, 60대 이상이 카드를 가장 많이 사용했고, 나이 역순으로 줄어드는 것이 흥미롭습니다. 이 데이터만 놓고 볼 때, 새해에 운동하겠다는 목표를 세우고 이를 가장 잘 실천하는 그룹은 60대라고 할 수 있습니다.
전체적으로 본다면 사람들은 새해보다 옷차림이 본격적으로 얇아지기 시작하는 6월에 운동을 더 많이 시작한다고 할 수 있는데요! 새해 결심보다 다이어트의 계절이라고 하는 여름에 운동하는 사람이 더 많은 것을 알 수 있습니다.
공공데이터로 확인해 본 계획 실천 여부, 하지만 아쉬움이 남네요.
지금까지 공공데이터를 통해 새해 운동 결심을 실천하고 있는지를 확인해보았습니다. ‘추천운동’의 검색량 데이터 분석 결과 1월에 검색하는 사람이 많은 것으로 미루어 보아 운동을 실천하는 사람이 많다는 것을 알 수 있었습니다.
운동장소 키워드인 ‘요가학원’, ‘필라테스학원’, ‘헬스장’의 검색량은 조금 다른 결과를 보였는데요, 세 가지 검색어 모두 새해보다 옷차림이 가벼워지는 여름철에 검색량이 높게 나타나 결심을 실천한다기보다는 다이어트에 관심이 많다고 볼 수 있었어요! 카드사용통계 데이터 역시 전체적으로 6월에 사용량이 가장 높게 나타나 여름철에 운동하는 사람이 많다는 사실을 알 수 있었습니다.
많은 사람이 새해 결심으로 ‘운동’을 다짐한 만큼 실천하는 사람도 많을 것이라고 생각했는데, 막상 결과는 새해보다 여름철에 운동을 실천하는 사람이 더 많았네요.
한편, 카드사용통계 데이터는 공공데이터의 한계를 극명히 나타내 아쉬움이 들었습니다. 최근 1년이라는 한정된 기간의 데이터만 받을 수 있고, 심지어 중간에 빠진 데이터가 있어서 분석하기 쉽지 않았기 때문입니다. 데이터 제공 기간이 보다 길고 누락된 데이터가 없었다면 다른 인사이트를 얻었을지도 모르는데 말이죠.
이와 더불어 금융기관에서 마이데이터 서비스를 시작했으니 이를 바탕으로 카드사용통계 데이터를 제공해주었으면 하는 좋겠다는 생각도 들었습니다. 물론, 데이터를 판매하고 있으나 개인이 구매해서 사용하기엔 부담스러우니까요. 보다 폭넓은 분야의 공공데이터를 통해 데이터를 활용하는 사람이 많아지고, 더 많은 인사이트를 얻을 수 있었으면 하는 바람을 담아 이번 콘텐츠를 마무리합니다.
Editor. 귤젤리