심층신경망의 설명가능성과 하이퍼파라미터 특성에 관한 연구 -중소기업 신용평가를 중심으로-
A Study on the Explainability and Hyperparameter Characteristics of Deep Neural Networks -A Case Study of SMEs Credit Scoring System-
김소정(서강대학교); 이군희(서강대학교)
42권 1호, 3~37쪽
초록
일반적으로 중소기업의 재무제표에 대한 신뢰성 문제는 오랫동안 제기되어 왔으며 이에 따라 결측치 및 이상치 비중이 상대적으로 높을 뿐만 아니라 오류에 의한 값인지 실제 값인지 명확하게 확인하기 어렵다. 이러한 이유로 일반적으로 신용평가 모형 구축 시 결측치와 이상치 값을 모두 제거하기 때문에 정보의 활용성이 낮을 뿐만 아니라 정확하고 고도화된 모형 구축에 어려움이 있었다. 본 연구에서는 이러한 중소기업 신용평가의 비정형화된 정보의 활용가능성에 주목하여 결측치와 이상치를 고려한 신용평가모형을 구축한다. 이를 위한 분석자료는 중소기업통합시스템(SIMS)에 해당하는 기업을 선별하여 총 1,758,760개의 데이터이며, 알고리즘은 로지스틱 회귀모형과 심층신경망을 이용하였고, 설명 가능한 AI 기법(XAI)을 활용하여 유의한 변수를 도출하였다. 결과적으로, 로지스틱 회귀모형과 비교하여 심층신경망 모형의 AUC가 높았으며, 부도 예측에 기여도가 높은 변수들은 이상치 변수를 포함하여 제조업이 재무적 특징을 잘 반영한 결과를 보였다. 이에 따라 부도 예측에 영향을 미치는 변수를 해석하고, 모형이 갖는 사용변수의 제약성을 줄이고 모형의 안정성과 일반화가 가능하다는 결론을 내릴 수 있었다.
Abstract
In general, the reliability of financial statements of SMEs has been raised for a long time and it is difficult to study the advancement of credit scoring system due to the difficulty of data collection. Due to these reasons when constructing the general credit scoring system, the system eliminates the missing value and outliers. Furthermore, the system has a low application of information, and it has difficulty constructing an accurate and advanced model. This study aims to construct an ideal credit scoring system considering the missing value and outliers by focusing on the usage of unstructured information in SMEs credit scoring system. The number of this basis of analytic data consists of 1,758,760(pieces) and it is selected by SIMS. The algorithm is based on logistic regression and deep neural networks. Significant variables were derived using explainable AI (XAI). In conclusion, the AUC had a higher outcome than the logistic regression model. The variables with a higher level of contribution to bankruptcy expectation offered results of the financial characteristic of the manufacturing industry, including outliers. On the basis of results, the model defines the effect of variables of bankruptcy expectation. Also, it is concluded that a model is possible to reduce the constraintability of variables, offering stability and generalization.
- 발행기관:
- 신용보증기금
- 분류:
- 중소기업경영