머신러닝을 활용한 금융 사기기업 조기탐지 모델링 연구: 기술보증기업 데이터 기반 탐지모형 개발 및 알고리즘 성능 비교
Early Detection Modeling of Fraudulent Firms Using Machine Learning: Development and Performance Comparison Based on Data Technology-guaranted SMEs
성형석(기술보증기금)
14권 2호, 87~115쪽
초록
본 연구는 기술보증기금의 보증지원 기업 데이터를 활용하여 정상기업과 사기기업을 식별하는 인공지능 기반 탐지모형을 개발하고, 다양한 머신러닝 알고리즘의 성능을 비교하였다. 최근 허위 자료 제출 등을 통해 기술보증기금을 속여보증을 받은 후 거액의 대출사기를 저지르는 사례들이 발생하면서, 보증심사 단계에서 부정대출을 조기에 탐지할 수있는 사전 경보 시스템의 필요성이 대두되고 있다. 이에 따라 본 연구에서는 2019년부터 2023년까지 기술보증기금을통해 보증을 받은 중소기업 55,219개사의 데이터를 수집하였으며, 이 중 보증 지원 후 1년 내 부도가 발생했거나 보증사기 혐의로 경찰에 적발, 수사받은 기업을 포함한 1,222개를 사기기업으로 정의하였다. 입력변수로는 기업 정보,대표자 특성, 재무 및 기술 관련 지표 등 총 59개 후보 변수를 고려하였고, 통계적 유의성과 변수 중요도 분석을 거쳐최종 18개의 예측변수를 선정하였다. 모델 개발 단계에서는 이상치 제거와 Min-Max Scale 등 전처리를 수행하였다. 특히 정상기업 대비 현저히 적은 사기기업 데이터를 효율적으로 학습하기 위해 성향점수매칭(PSM: PropensityScore Matching) 기법을 활용하여 학습용 데이터를 정상기업 1,222개와 사기기업 1,222개로 균형화하였다. 이러한데이터로 로지스틱 회귀, 랜덤포레스트, XGBoost, 인공신경망 등 여러 알고리즘을 학습시키고 교차검증을 통해 하이퍼파라미터를 최적화하였다. 독립된 테스트셋을 활용한 성능 평가 결과, 랜덤포레스트 모형이 재현율(Recall) 등 사기기업 탐지능력이 가장 뛰어났고 F1스코어도 최고를 기록하였다. 한편 로지스틱 회귀모형은 재현율이 비교적 낮았으나,분류 임계값을 조정하여 민감도를 높이면 실무적으로 활용가치가 높을 것으로 판단된다. 그리고 오경보가 늘어나 정밀도(Precision)는 떨어졌지만, ROC-AUC는 모든 모델 중 가장 우수한 분류 판별력을 나타냈다. XGBoost와 신경망모형은 재현율과 F1스코어 측면에서 전반적으로 성능이 낮은 수준으로, 특히 신경망의 재현율이 가장 낮았다. 이는 학습 데이터가 제한적인 상황에서 복잡도가 높은 신경망이 충분히 일반화되지 못했기 때문으로 추정된다. 한편 로지스틱회귀모형은 확률적 산출의 일관성과 변수 해석가능성 측면에서 장점을 보여주었는데, 본 연구에서는 로지스틱 회귀의예측확률을 기반으로 총 10단계 위험등급체계(AAA~D)를 설계하여 모델 예측결과를 직관적으로 활용하는 방안을 제시하였다. 이러한 위험등급은 기업별 사기 발생 위험도를 백분위 구간으로 표현한 것으로, 최상위 AAA등급은 가장 안전한 기업군, 최하위 D등급은 가장 위험한 기업군을 의미한다. 본 연구는 실증분석을 통해 머신러닝 기반 사기기업사전 탐지모형의 실효성을 확인하였으며, 특히 해석가능한 등급화 모델을 도입함으로써 정책현장에서 활용할 수 있는사전적 관리체계의 가능성도 제시하였다. 향후 정책자금 사전심사 시스템 프로세스에 본 모형을 접목할 경우, 한정된정책자금 재원을 올바른 창업기업에게 안정적으로 공급하고 부정대출을 예방하는 데 다소 기여할 수 있을 것으로 기대된다.
Abstract
This study develops an AI-based detection model to distinguish between legitimate firms and fraudulentfirms using data from the Korea Technology Finance Corporation (KOTEC), and compares theperformance of various machine learning algorithms. Recently, several cases have emerged in whichfirms obtained guarantees from KIBO by submitting falsified documents and subsequently committedlarge-scale loan fraud, highlighting the need for an early warning system capable of detecting fraudulentactivities at the guarantee screening stage. To address this issue, data were collected from 55,219 smalland medium-sized enterprises (SMEs) that received guarantees between 2019 and 2023. Among them,1,222 firms were defined as fraudulent firms. if they either defaulted within one year after receivinga guarantee or were detected and investigated by the police for fraud. A total of 59 candidate variables—including firm characteristics, representative attributes, financial indicators, and technology-relatedmeasures—were considered, from which 18 significant predictors were selected through statisticaltesting and feature importance analysis. Preprocessing steps such as outlier removal and Min-Maxscaling were applied. To address the severe class imbalance, Propensity Score Matching (PSM) wasemployed to construct a balanced training dataset consisting of 1,222 fraudulent firms and 1,222non-fraudulent firms. Multiple algorithms, including logistic regression, random forest, XGBoost, andartificial neural networks, were trained, with hyperparameters optimized via cross-validation. Theempirical results using an independent test set revealed that the random forest model achieved thehighest recall and F1 score, demonstrating superior detection capability for fraudulent firms. Logistic regression, although yielding relatively low recall, showed the best classification power in terms ofROC-AUC and could be practically useful when classification thresholds are adjusted to improvesensitivity, despite the resulting decline in precision. XGBoost and neural networks exhibitedcomparatively lower performance in both recall and F1 score, with neural networks showing the weakestrecall, likely due to insufficient generalization under limited training data. Nevertheless, logisticregression offered advantages in terms of probabilistic consistency and interpretability. Based on itspredictive probabilities, a ten-tier risk grading system (AAA to D) was designed, which stratifies firmsinto percentile-based risk categories: the top 10% (AAA) as the safest and the bottom 10% (D) asthe riskiest. This study demonstrates the practical applicability of machine learning-based early detectionmodels for fraudulent firms and proposes an interpretable grading framework that can be utilized inpolicy and guarantee screening practices. Incorporating such models into the policy financing processis expected to contribute to the efficient allocation of limited financial resources to genuine startupswhile preventing fraudulent loan practices.
- 발행기관:
- 기술보증기금
- 분류:
- 기업/산업/기술경영