[SW교육] 데이터 기반의 sw 교육 – 실습 사례 #1 <교통사고는 어디서 많이 발생할까?>

On 10월 11, 2016

[SW교육] 데이터 기반의 sw 교육 – 실습 사례 #1 <교통사고는 어디서 많이 발생할까?>

 

안녕하세요, 데이터 시각화 전문기업 뉴스젤리입니다.

 

오늘부터 데이터기반의 sw교육에서 진행되었던  ‘실습 사례’ 블로그 포스팅이 새로이 시작됩니다! 우리 주변에서 벌어지는 다양한 현상들과 문제들에 대해 데이터를 기반으로 해석/분석하고 이에 대한 해결책을 제시하면서 마무리 짓는 형식으로 진행할 예정입니다. 많은 관심과 기대 부탁 드리겠습니다. 더불어 뉴스젤리가 진행하고 있는 다양한 교육 프로그램에도 많은 관심 가져 주세요! 🙂

 

첫 번째 실습 사례는 <교통사고는 어디서 많이 발생할까?>입니다.

지난 한 해 교통사고 발생 건수 총 31만 5736건. 하루 평균 교통사고 발생 건수 635건으로 교통사고는 우리 주변에서 쉽게, 자주 일어나곤 합니다. 영화 <If Only>를 보셨나요? ‘오늘이 인생의 마지막인 것처럼 사랑하라’는 명언을 남긴 영화로, 교통사고로 사랑하는 사람(사만다)을 잃고 그녀를 다시 구하고자 하는 한 남자(이안)의 타임 루프로 구성되어 있지요. 간단한 접촉사고부터 영화 <If Only>처럼 누군가를 잃는 일이 일어날 수 있는 ‘교통사고’에 대해 데이터로 분석해보는 시간 되겠습니다.

 

%ea%b5%90%ed%86%b5%ec%82%ac%ea%b3%a0-%eb%8b%a4%eb%b0%9c%ec%a7%80%ec%97%ad

 

“전국 교통사고 다발지역 상위 5곳”을 조사하여 나타낸 신문기사(2014.9.23일자)입니다. 서울시는 2013년 한 지역(광주 서구)를 제외한 상위 4곳을 차지했고, 2012년에는 상위 5곳 모두를 차지하고 있습니다. 2013, 2012년 전국 교통사고 다발지역 1위를 모두 차지한 지역은 서울시 내에서도 ‘강남구’네요. 그렇다면 여기서부터 시작해보겠습니다.

 

question

 

  • 교통사고는 어디서 많이 발생할까?

  • 왜 “강남”에서 교통사고가 많이 발생할까?

 

 

data-keyword

 

사례 검증을 통해 분석해야 할 데이터 키워드를 선정해보면, 크게 [교통사고, 교통사고 발생, 교통사고 현황] 정도가 될 것 같습니다. 항상 상위를 차지했던 서울시 교통사고 관련 데이터를 활용해보겠습니다.

 

%ec%84%9c%ec%9a%b8%ec%8b%9c-%ea%b5%90%ed%86%b5%ec%82%ac%ea%b3%a0%ed%98%84%ed%99%a9%ed%86%b5%ea%b3%84

 ‘서울시 교통사고현황통계’, 서울 열린데이터광장, 2012

http://data.seoul.go.kr/visual/content/3521

 

서울시 교통사고 현황 그래프입니다. 강남구>송파구>영등포구>서초구>동대문구 순으로 교통사고가 발생하고 있습니다. 강남구는 뒤따르고 있는 2위 송파구의 약 1.5배로, 큰 차이를 보이고 있습니다.

 

%ec%b0%a8%eb%8c%80%ec%82%ac%eb%9e%8c      %ec%9d%8c%ec%a3%bc%ec%9a%b4%ec%a0%84          %eb%ba%91%ec%86%8c%eb%8b%88

‘교통사고 현황’ 中 ‘차대사람’ , 서울특별시, 2012

http://data.seoul.go.kr/visual/content/3522

‘서울시 음주운전 사고 현황’ 中 발생건수, 서울특별시, 2015년

http://data.seoul.go.kr/visual/content/3504

‘서울시 뺑소니 교통사고 현황 통계’, 서울특별시, 2012

http://data.seoul.go.kr/visual/content/3505?filtered=true

 

‘차대사람’, ‘음주운전 사고’, ‘뺑소니’ 등 교통사고 원인으로 꼽히는 항목을 하위 키워드로 선정하여 분석했을 때 역시 강남이 가장 높은 순위를 차지했습니다. 그렇다면 왜, 강남에서, 사고가 많이 발생하는지 키워드를 통해 가설을 세워보겠습니다. 인구 수, 인구밀도, 차량 통행량, 횡단보도 수, 교통표지판 수 등 생각해볼 수 있는 다양한 구조적 원인 중에서 유력 후보를 골라보면,

 

  1. [유동인구]가 가장 많기 때문이다.

  2. [차량통행량]이 가장 많기 때문이다.

  3. [횡단보도]가 가장 많기 때문이다.

 

본격적으로 DAISY를 활용하여 데이터를 시각화하고, 각각의 가설을 검증해보겠습니다.

 

 

  1. [유동인구] 가설 검증

 

%ec%9c%a0%eb%8f%99%ec%9d%b8%ea%b5%ac

‘2014년도 1주일 평균 유동인구’, 서울시정보소통광장

http://data.seoul.go.kr/visual/content/3784

 

 

%ec%a7%80%ed%95%98%ec%b2%a0-%ed%98%bc%ec%9e%a1%eb%8f%84 %ec%8a%b9%ed%95%98%ec%9e%90-%ec%9d%b8%ec%9b%90

‘서울시 지하철 혼잡도 통계’, 서울특별시, 2012

http://data.seoul.go.kr/visual/content/3503?filtered=true

‘서울시 지하철 역 별 승하차 인원 현황’, 서울특별시, 2013~2015

http://data.seoul.go.kr/visual/content/3541?filtered=true

 

1%ec%9d%bc-%ed%86%b5%ec%8b%a0%eb%9f%89               %ec%8b%9d%ed%92%88%ec%a0%91%ea%b0%9d%ec%97%85

SKT 가입자의 2014년 5월 13일 통신량(음성통화/문자/데이터 등)을 기준으로 추정한 1일 통신량 수

http://data.seoul.go.kr/visual/content/3783

‘서울시 식품접객업등록현황’, 서울특별시, 2014년 (일반음식점 · 유흥주점 · 단란주점)

http://data.seoul.go.kr/visual/content/3562

 

 

유동인구’만’으로 따졌을 때는 관광객이 몰리는 중구(명동), 오피스 밀집 지역인 종로구(광화문, 시청 등)가 우위를 보이며 강남은 6위를 차지했습니다. 재미있는 사실은 유동인구 관련 다른 데이터에서는 강남이 모두 1위를 차지했다는 점입니다.  아래 그래프를 보시면, 가장 혼잡한 지하철 호선인 2호선 중에서도 ‘강남역’은 승하차 인원 1위를 차지했습니다. SKT에서 조사한 가입자 대상 1일 통신량(2014.5.13일자 기준)에서도 강남구는 1위를 차지, 서울시 식품접객업 등록 현황 자료를 토대로 만남의 장소로서도 압도적인 1위를 차지하고 있습니다. 유동인구 지표에서는 밀리지만, 많은 사람들이 생활하고 왕래하면서 교통사고 발생 확률을 높이는 다양한 요인들이 기인하고 있음을 알 수 있습니다.

가설 1번으로는 명확하게 설득하기 힘들 것 같습니다. 유동인구 자체로만 생각하면 교통사고 발생의 핵심 원인이 아니지만, 여러 데이터를 감안했을 때 교통사고가 날 변수는 많다고 할 수 있겠습니다.

 

 

  1. [차량통행량] 가설 검증

 

%ea%b0%84%ec%84%a0%ea%b5%90%ed%86%b5%eb%9f%89

‘2015 서울특별시 교통량 조사자료’ 中 간선교통량(32개 지점), 서울시

http://data.seoul.go.kr/visual/content/3581

http://data.seoul.go.kr/visual/content/3741

 

서울시 간선교통량 통계 자료입니다. 우측 트리맵 차트를 보시면 강남구는 차량통행량 2위를 차지했음을 알 수 있습니다.  가설 1번과 마찬가지로, 가설 2번이 강남 지역이 최다 교통사고 발생지라는 것을 증명하기에는 한계가 있습니다.

***간선도로(ex)중랑교, 연희I.C, 금호터널 등)를 중심으로 분석한 통계자료이므로, 좌측 서울지도에서 검은색으로 표기된 부분은 해당 지역 간선도로 자료가 나와 있지 않기 때문입니다. 🙂

 

 

  1. [횡단보도] 가설 검증

 

‘횡단보도가 가장 많기 때문이다’를 유력 키워드 및 가설 3번으로 선정한 이유는, 교통사고가 발생할 수 있는 상황을 가정했을 때, 보행자 기준 사고현황을 보면 횡단보도에서 교통사고가 일어나는 일이 70% 이상을 차지하기 때문입니다.

%ed%9a%a1%eb%8b%a8%eb%b3%b4%eb%8f%84

데이터:‘서울시 보행자사고현황통계’, 서울시, 2012년

http://data.seoul.go.kr/visual/content/3523?filtered=true

 

%ec%84%9c%ec%9a%b8%ec%8b%9c-%ed%9a%a1%eb%8b%a8%eb%b3%b4%eb%8f%84-%ec%88%98%ec%8b%a0%ed%98%b8%eb%93%b1

‘서울시 횡단보도통계’, 서울시, 2012. 2. 1

http://data.seoul.go.kr/visual/content/3524

 ‘서울시 횡단보도통계’ 中 신호등 없는 횡단보도  상위 5개 지역, 서울시, 2015

http://data.seoul.go.kr/visual/content/3582

 

강남구는 서울시에서 횡단보도가 가장 많을 뿐만 아니라 신호등이 없는 횡단보도가 많은 지역으로도 1위를 차지했습니다. 즉, 왜 강남구에서 교통사고가 많이 발생하는가,에 대해 가설 3 이 가장 타당한 원인으로 보입니다. 또한 신호등이 없는 횡단보도가 많아 사고 발생률이 더욱 높아져 시민의 안전이 보장되지 못하고 있다는 의미 역시 내포하고 있습니다.

 

 

conclusion

 

교통사고가 가장 많이 발생하는 지역은 서울시 강남구.

강남에서 교통사고가 많이 발생하는 원인은 신호등이 없는 횡단보도가 많기 때문이라 추정해 볼 수 있습니다.

서울시민의 안전 확보를 위해 다음과 같은 해결 방안을 고려할 수 있겠습니다.

1) 횡단보도에 신호등을 추가로 설치할 것

2) 동선을 고려한 새로운 횡단보도 설치 시 신호등 설치에 대한 논의를 필수로 할 것

 

우리는 문제 해결을 위해 데이터를 수집하고 분석하는 과정에서 Design Thinking 프로세스를 활용했습니다. 이를 통해 데이터를 보다 쉽게 파악하여 인사이트를 얻었죠.

하나의 현상 혹은 문제와 가장 타당해 보이는 문제 해결 방안에 대해서 현장 검증 및 제도 개선의 프로토타입을 설계해보는 디자인 프로세스로 연결함으로써, 우리 주변에서 일어나는 일에 대한 해결책을 찾아낼 수 있을 것입니다.

 

오늘의 데이터기반의 sw교육 실습은 여기까지 입니다.

다음은 ‘실습사례#2 환경오염’ 편으로 찾아 뵙겠습니다.

 

데이터 활용에 가치를 더합니다.
누구나 즐길 수 있는, 데이터 시각화 솔루션 “데이지(DAISY)”
데이지 문의 : daisy@newsjel.ly
소개 영상 : https://youtu.be/FfuCPjmVHFA
브로셔 다운로드 : https://goo.gl/laV50j
  • By 뉴스젤리  1 Comments   
  • DAISY, data storytelilng, data visualization, design thinking, design thinking with data, design thinking 실습, sw교육, 공공데이터, 공공데이터 활용, 교통사고, 교통사고 발생, 데이터 시각화

    1 Comments

    Posted by 남군 on
    • 11월 11 2016
    응답  
    실습은 어떻게 참가하나요? +_+ + 특정 언어나 툴에대한 어느정도의 지식이 필요한지도 알려주시면 감사하겠습니다 +_+

    Leave a Reply

    이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.

    2 + twelve =