애스크로AIPublic Preview
← 학술논문 검색
학술논문지능정보연구2025.06 발행KCI 피인용 1

대출목적 정보의 텍스트 마이닝을 이용한 그래프 네트워크 기반의 개인신용평가모형

Graph Neural Network-based Personal Credit Rating Prediction Using Loan Purpose Text Information

홍태호(부산대학교); 김민수(부산대학교); 김은미(부산대학교 경영연구원)

31권 2호, 215~233쪽

초록

개인신용평가에서 개인채무 불이행 예측은 정량 정보가 주로 사용되었으나, 사회초년생, 노년계층 등 금융이력이 부족한 경우에는 적용하기 어렵다는 한계가 존재한다. 이에 따라 정성정보를 대출 신청자의 채무 불이행 예측모델에 활용하여금융이력이 부족한 씬파일러에게도 적용이 가능한 예측모형을 구축하고자 한다. 특히 텍스트 정보는 사전 학습된 언어모델을 임베딩하거나, 텍스트 데이터에서 사용자의 성격 및 심리적 특성을 간접적으로 추출하는 방식으로 활용되어 왔다. 먼저, 이러한 텍스트 정보의 활용 가능성과 예측 모형의 성능 향상을 위해 대출 신청 과정에서 제공된 서술 텍스트 정보를 이용해 채무 불이행 위험을 예측하는 방법을 비교하고 성능을 분석하였다. BERT를 활용하여 텍스트 정보를 벡터 형태로 임베딩하는 방식, LIWC를 사용하여 텍스트에서 개인의 심리적 특성을 간접적으로 측정하는 방식, 그리고 텍스트의 긍부정 감성값을 추출하는 방안을 비교하였다. 실험 결과, BERT를 활용했을 때 가장 우수한 성과를 보여주었다. 다음은 텍스트 정보와 금융 정보를 결합한 그래프 신경망 기반의 개인신용평가 모형을 제안하였다. 오토인코더 기반의 BERT와 그래프 신경망을 결합하여 텍스트와 금융 정보 간의 복잡한 비선형 관계를 효과적으로 모델링하여 채무 불이행 위험을 예측하였다. 그래프 신경망 기반의 예측 모형은 기존의 로짓, SVM, XGBoost, 인공신경망, 심층신경망 기법들보다 우수한 예측 성과를 보였다. 본 연구는 비정형 데이터의 활용이 중요해지는 금융 분야에서 텍스트 정보의 활용 방안을 제시하고,복잡한 변수 간 관계를 반영하는 그래프 신경망 모형을 제안했다는 점에서 의의가 있다. 제안된 방법론은 중 저신용자를위한 대안신용평가나 신용평가 자동화 등 금융 서비스 혁신에 기여할 수 있을 것이다.

Abstract

Personal credit rating is an essential process in financial institutions’ loan decision-making,traditionally relying on quantitative information directly linked to an individual’s financial status. However,this approach has limitations in predicting credit risk for thin filers, who have insufficient financial history. Recently, the potential of utilizing unstructured data has garnered attention, and research is actively beingconducted to improve the performance of personal default prediction models by using qualitativeinformation, such as text generated by individuals. Therefore, this study explores methods of utilizing textinformation in predicting personal loan delinquency using LendingClub data. Firstly, three approaches toutilizing text information were compared: BERT-based text embeddings, psychological feature extractionusing the LIWC dictionary, and sentiment polarity analysis. The results of applying these methods tovarious machine learning models showed that the text vector embedding method using BERT exhibitedsuperior predictive performance compared to the LIWC or sentiment dictionary-based methods. Secondly,a predictive model based on Graph Neural Networks (GNN) was proposed to reflect the non-linearrelationships between financial information and text. The proposed model integrated the applicant’s personalinformation, financial history, and BERT-embedded text to represent the relationships between applicantsin a graph structure, constructing a delinquency prediction model using a GNN structure. Experimentalresults showed that the GNN model achieved the highest predictive performance compared to traditionalstatistical models, machine learning models, and deep neural network models. The proposed methodologyis expected to contribute to financial service innovation, such as alternative credit assessment formedium-to-low credit individuals and automation of credit evaluation.

발행기관:
한국지능정보시스템학회
분류:
산업공학

AI 법률 상담

이 논문의 주제에 대해 더 알고 싶으신가요?

460만+ 법률 자료에서 관련 판례·법령·해석례를 찾아 답변합니다

AI 상담 시작
대출목적 정보의 텍스트 마이닝을 이용한 그래프 네트워크 기반의 개인신용평가모형 | 지능정보연구 2025 | AskLaw | 애스크로 AI