스코어 얼라인먼트 기반 중소기업 부도예측모형의 운영 효율화
Operation Efficiency of SME Default Prediction Models Based on Score Alignment
정승철(신용보증기금); 김지현(교보생명보험 주식회사); 신현수(주식회사 신나는세상); 주종훈(연세대학교 정보대학원)
44권 4호, 63~98쪽
초록
본 연구는 2014년부터 2021년까지 신용보증기금을 이용하고 있는 중소기업 데이터를 활용하여, 중소기업의 부도 가능성을 예측하는 모델을 구성하였다. 국내외 신용평가회사들이 신용평점에 대한 투명하고 용이한 설명을 위해 로지스틱 회귀분석을 사용하는 것처럼, 본 연구에서도 같은 목적을 위해 로지스틱 회귀분석을 사용하였다. 특히 변별력 향상을 위해 모든 변수에 대해 구간화(Binning) 작업을 수행하여 이를 입력변수로 사용 하였고, 해당 중소기업 수와 타겟률을 고려해 5개의 세그먼트(Segment)를 생성하여 각 세그먼트별로 모델링을 실시하였다. XGBoost, Neural Network 등 다른 분석 방법과 비교 시, 구간화와 세그먼트 기반 로지스틱 회귀분석이 예측결과에 대한 설명력이 우수하고, 변별력도 뒤처지지 않음을 확인하였다. 더 나아가 경기변동에 의해 신용평점과 신용리스크 간의 관계가 변화할 때, 금융기관이 신용평점 기반 컷오프(Cut-off) 전략에서 모델 재구축 없이 손쉽고 빠르게 개발 당시의 의도대로 모델을 적용 할 수 있는 방법을 제안하였다. 이는 PDO(Points to Double Odds)와 Odds 기반의 스코어링을 통해 모델 개발 시점에서의 부도율에 대한 로짓(Logit)과 스코어(신용평점) 간의 기준선을 설립하고, 적용 시점의 로짓과 스코어 간 직선을 개발 시점의 기준선으로 회전 변환함으로써 모델을 효율적으 로 운영할 수 있다.
Abstract
This study utilized data from small and medium-sized enterprises (SMEs) that have accessed the Korea Credit Guarantee Fund from 2014 to 2021 to construct a model for predicting the likelihood of SME defaults. Similar to international and domestic credit bureaus using logistic regression models for transparent and straightforward explanations of credit score, this research also employed logistic regression models for the same purpose. Particularly, to enhance discriminative power, binning was performed on all variables, which were then used as input variables. Considering the number of SME and the target rate, five segments were created, with modeling conducted for each segment. When compared with other methods such as XGBoost and Neural Network, the logistic regression model based on binning and segmentation was found to provide excellent explanatory power and competitive discriminative ability in prediction results. Furthermore, this research proposes a method that allows financial institutions operating credit score-based cutoffs to apply the model as intended during its development without needing to rebuild it, even when the relationship between credit scores and credit risks changes due to economic fluctuations. This involves establishing a baseline between the logit of default probability and the score at the time of model development using PDO (Points to Double Odds) and odds-based scoring, and rotationally transforming the line between logit and score at the application time back to the baseline established at development time, thereby enabling efficient model operation.
- 발행기관:
- 신용보증기금
- 분류:
- 중소기업경영