빅데이터 분석 기반의 코로나 바이러스 사망자 수 예측 - 변화점 추적 방식과 예측조합법을 중심으로 -
Prediction of Corona Virus Deaths Based on Big Data Analysis - Focusing on the Change Point Detection and the Forecast Combination method -
김정우(강릉원주대학교)
9권 7호, 263~275쪽
초록
코로나 바이러스 확산세가 감소되는 시기에 본 연구는 다양한 예측기법들을 활용하여 코로나 바이러스 사망자 수를 예측하고자 하였다. 코로나 바이러스 통계와 관련한 기존 연구들은 주로 확진자 수 예측을 중심으로 자기회귀 모형, 시계열 딥러닝 모형을 활용하여 이루어진 데 반해, 본 연구는 다양한 머신러닝 및 딥러닝 기법과 시계열 모형을 사용하였으며, 특히 코로나 바이러스 사망자 자료의 높은 변동성을 감안하여 변화점 추적 방식을 통한 구간 분할 및 예측조합법을 사용하여 예측 안정성을 높였다. 본 연구는 코로나 바이러스 사망자 수를 종속변수로 하고, 코로나 바이러스 관련 통계 자료들과 사회적 거리두기, 일별 온도 등을 설명변수로 설정하여 다양한 예측기법들과 2가지의 예측조합법을 적용하여 예측결과들을 비교하였다. 분석 결과, 변화점 추적 방식에 따른 구간별로 높은 예측성능을 보이는 예측기법의 종류는 다소 상이하였으나, 전반적으로 예측조합법의 예측성능이 높았으며, 특히 예측안정성 측면에서는 예측조합법이 우수한 것으로 나타났다. 이에 따라, 본 연구는 코로나 바이러스 사망자 수를 예측하는데 있어서 정확성과 안정성을 도모하여 실용성이 높다고 볼 수 있다.
Abstract
As the spread of the corona virus slows down, this study predicts the corona virus deaths in Korea using various prediction methods. While the previous studies in this domain mainly focused on predicting the corona virus confirmed cases using autoregressive models and deep learning based time-series models, this study aims at the accurate prediction of the corona virus deaths using various machine learning methods with the above prediction methods. In particular, this study facilitated the prediction stability by adopting change-point detection and forecasting combination method. As explanatory variables, this study used various corona virus-related data, social distancing level and daily temperature, and it also showed the comparison of the prediction results of various prediction methods and two forecasting combination methods. The prediction performances of the various prediction methods differed depending on the prediction interval segmented by change-point detection. But it was found that the forecast combination methods mainly showed more accurate prediction results compared to other methods. In addition, the forecast combination methods showed the low volatility of the prediction error implying their stability of prediction. This study has significance in that it accurately predicted the corona virus deaths and achieved the accuracy and stability of the prediction, facilitating the practicality in the real application cases.
- 발행기관:
- 사단법인 한국융합기술연구학회
- 분류:
- 학제간연구