최근 비대면 서비스의 증가로 이륜차의 이용 및 그에 따른 사고 건수가 증가하고 있다. 본 연구에서는 불균형한 사고 데이터의 특성을 고려하여 이륜차의 사고 심각도를 예측하고, 비용 민감 학습을 적용한 심층신경망(DNN)을 활용하여 사고 심각도가 높은 지역을 도출하였다. 서울특별시 내의 2014년부터 2019년의 사고 데이터셋을 구득 하고, 도시계획, 사회통계학, 교통과 관련한 지표를 모델 입력변수로 삽입하였다. 제안하는 방법론의 성능을 평가하고자 Hyperparameter에 따른 결과를 확인하고 비용 민감 학습과 다른 유사 방법론 간의 비교 분석을 수행하였다. 연구 결과, 본 연구에서 제안하는 모델이 73%의 정확도와 80%의 F1-score의 성능을 보였다. 제안된 방법론은 기존의 불균형 데이터 처리 기법 및 방법론에 비하여 사고 심각도를 클래스별로 균형적으로 예측한 것을 확인하였다. Random Forest를 활용한 요인의 중요도 분석 결과, 음식점 수, 교차로 수, 인구, 도로 위계, 유년부양비의 비율이 중요도가 높은 요인으로 도출되었다. 본 연구는 이륜차의 사교 규모를 모형화하고 국내를 대상으로 그리드별 사고 심각도 예측을 수행함으로써 사고 규모를 산출하였다. 본 연구의 결과를 활용하여 이륜차 보험 및 안전 정책에 기여할 수 있을 것으로 기대한다.
This study addresses the prediction of two-wheeler accident severity, taking into account the challenges of imbalanced data. We employ a deep neural network (DNN) with cost-sensitive weight. Our approach incorporates urban planning, sociodemographic, and transportation indicators as input variables. To assess the performance of our methodology, we systematically evaluate results across various hyperparameters and conduct a comparative analysis against related methodologies. By applying cost-sensitive learning to our DNN model, we identify optimal hyperparameters that achieved positive results, with an accuracy rate of 73% and an F1-score of 80%. Our methodology demonstrates the ability to predict accident severity across different classes with less bias than other sampling and classification methods. The importance of Random Forest analysis highlights the significance of variables such as the number of intersections, number of restaurants, population, road hierarchy, and youth dependency ratios in determining accident severity. Our study contributes valuable insights for informing two-wheeler insurance and safety policy initiatives.