애스크로AIPublic Preview
← 학술논문 검색
학술논문형사정책연구2025.09 발행

랜덤 포레스트 기반 소년범 재범 예측 모델의 최적화: 변수 선택과 불균형 데이터 보정 전략의 효과

Optimization of Random Forest-Based Juvenile Recidivism Prediction Models: Effects of Variable Selection and Imbalanced Data Correction Strategies

윤일홍(조선대학교); 권해수(조선대학교)

36권 3호, 125~152쪽

초록

본 연구는 우리나라 청소년 재범 예측 실무에서 널리 활용되는 로지스틱 회귀 기반 소년보호교육종합관리시스템 비행위험성 진단체계(TEAMS RA-Ⅱ)의 한계와 개선 가능성을 검토하였다. TEAMS 자료를 활용하여 변수 개수(20∼40개), 불균형 데이터 보정 전략(비용민감 랜덤 포레스트, SMOTE, Youden’s Index) 및 임계값 설정을 달리한 총 30개의 랜덤 포레스트 기반 예측모형을 구축하고 정확도, 민감도, 특이도, 균형정확도, AUC 등의 성능을 비교・분석하였다. 분석 결과, 불균형 보정을 적용하지 않은 모델은 특이도는 매우 높으나 민감도가 극히 낮아 실무 활용성이 떨어졌다. 반면 SMOTE와 Youden’s Index를 결합한 모델은 균형정확도와 민감도가 크게 향상되었다. 특히 최적 모델은 25개 변수를 사용한 Youden’s Index 기반 랜덤 포레스트 모델로 확인되었으며, 이는 현재 TEAMS RA-II 체계가 동일하게 25개 변수로 구성되어 있다는 점과 부합하여 해당 체계의 변수 개수 선정의 타당성이 통계적으로 지지됨을 보여준다.

Abstract

This study examined the limitations and potential improvements of the TEAMSRA-II, a logistic regression-based risk assessment tool widely used in South Korea for predicting juvenile recidivism. Using TEAMS data, we constructed 30 Random Forest-based prediction models by varying the number of predictors (20-40), applying different imbalance-handling strategies (Cost-Sensitive Random Forest, SMOTE, Youden’s Index), and adjusting classification thresholds. Model performance was evaluated in terms of accuracy, sensitivity, specificity, balanced accuracy, and AUC. The results showed that models without imbalance correction achieved very high specificity but extremely low sensitivity, limiting their practical applicability. In contrast, models combining SMOTE with Youden’s Index substantially improved both balanced accuracy and sensitivity. The optimal model was identified as the Youden’s Index-based Random Forest model using 25 predictors, which is consistent with the current TEAMS RA-II framework that also employs 25 variables. This finding statistically supports the validity of the variable selection in the existing TEAMS RA-II system.

발행기관:
한국형사법무정책연구원
분류:
법학

AI 법률 상담

이 논문의 주제에 대해 더 알고 싶으신가요?

460만+ 법률 자료에서 관련 판례·법령·해석례를 찾아 답변합니다

AI 상담 시작
랜덤 포레스트 기반 소년범 재범 예측 모델의 최적화: 변수 선택과 불균형 데이터 보정 전략의 효과 | 형사정책연구 2025 | AskLaw | 애스크로 AI