애스크로AIPublic Preview
← 학술논문 검색
학술논문대한경영학회지2023.07 발행KCI 피인용 2

머신러닝을 활용한 군특성화고 전문병 선발 예측 및 특성 탐색

Prediction and Characteristic Exploration of Military Specialized High School Trainee Selection Using Machine Learning

김성일(한국기술교육대학교); 이장희(한국기술교육대학교)

36권 7호, 1173~1191쪽

초록

군특성화고 정책은 양질의 군인적자원을 수급하기 위해 도입된 정책으로 학·군(學軍) 협력을 기반으로 하는국방인적자원관리(Military HRM)의 성격을 지닌다. 이에 본 연구는 머신러닝을 활용하여 군특성화고 정책이 내재한인적자원개발의 측면을 실증적으로 분석하고 전문병 선발 예측 모델과 중요 변수를 제시한다. 이를 위해 국내 군특성화고등학교 A학교의 졸업생 850여 명의 교육 및 진로 데이터의 전처리를 수행하여 50여개의 투입변수를 최종적으로 획득하였다.‘전문병 선발’을 타겟변수로 선정하여 과대 표집을 통해 타겟변수의 클래스불균형을 해소한 후 머신러닝의 예측모델을 훈련하였다. 전문병 선발을 정확하게 예측할 수 있는 최적 모델 수립을 위해 Random Forest, XGBoost, LightGBM, SVM, Logistic과 같은 5개 머신러닝 알고리즘을 타겟변수 클래스가 불균형한 원천 데이터와 과대표집을 시행한 과대 표집데이터에 모두 적용하여 총 10개의 모델을 훈련하였다. 모델 훈련 과정에서 층화 k-Fold 교차검증을 함께 수행하여과적합을 예방하였고 최적 모델을 구현하는 데 적합한 초매개변수를 탐색하였다. 훈련 결과 Random Forest 알고리즘으로 훈련한 모델의 예측 성능이 원천 데이터 및 과대표집 데이터로 훈련한모든 경우에서 가장 우수하였다. AUC값을 기준으로 할 때 원천 데이터로 훈련한 Random Forest(RF) 모델 성능은0.76에 근사했고 과대표집 데이터로 훈련한 Random Forest 모델(RF_over) 성능은 0.85 수준으로 향상했다. 투입변수 중요도를 평가한 결과 50여 개 투입변수 중‘면허_취득/미취득’, ‘전공기능사’ 등 전공 전문성과 관련된변수가‘전문병 선발’여부에 가장 큰 영향을 미친 것으로 나타났다. 추가적으로 모델의 편향성을 점검하기 위해 원천 데이터와 과대표집 데이터를 무작위로 표집하여 평가를 실시한결과 RF와 RF_over 두 모델의 AUC 값이 모두 0.5에 수렴하는 결과를 보였다. 이는 훈련한 머신러닝 모델이 특정변수에 의존하지 않으면서 상당한 수준의 성능을 보이는 것으로 이해할 수 있다. 본 연구의 결과는 머신러닝을 활용한 군특성화고 연구의 가능성을 제시할 뿐 아니라 실제 교육현장에서 군특성화고정책의 효과성에 기여하는 요소를 특정할 수 있음을 보여준다. 이러한 결과는 군특 전문병의 원활한 선발과 수급을위해 전공 전문성 및 교육훈련을 강화한 인적자원관리의 필요성을 제기한다. 또한 이를 통해 머신러닝을 활용한인사이트 획득과 데이터에 기반한 전사적 국방인적자원관리의 가능성을 모색할 수 있을 것으로 기대한다.

Abstract

The study uses machine learning to present a predictive model and important variables for military trainee selection in Military Specialized High School (MSHS). To this end, the education and career data of 850 graduates from a MSHS were analyzed using machine learning algorithms based on Python. For the data, ‘trainee selection’ was selected as the target variable, and about 50 input variables were composed. In order to establish an optimal model that can accurately predict trainee selection, five machine learning algorithms such as Random Forest, XGBoost, LightGBM, SVM, and Logistic are applied to both the original data with imbalanced target variable classes and the over-sampled balanced data. To mitigate over-fitting during the model training process, we employed stratified 5-fold cross-validation. Additionally, we searched suitable hyper-parameters, thereby implementing the optimal model. Following the training process, the random forest algorithm exhibited the highest prediction performance among all the models trained. The random forest model trained with the original imbalanced data achieved commendable AUC score of approximately 0.76. The performance of the random forest model trained with the oversampling imbalanced data showed significant improvement, reaching AUC score of 0.85. As a result of evaluating the importance of input variables, it was found that among 50 input variables, variables related to specialized major qualifications, such as ‘Engineer license_acquisition/non-acquisition’ and ‘crafts licenses’, had the greatest impact on whether or not to select trainees. The results of this study not only suggest the possibility of machine learning application research on MSHSs, but also show that the factors contributing to the effectiveness of MSHS policies in the educational field can be specified. Therefore, machine learning can be used as a meaningful methodology to promote an empirical understanding of research and policy on MSHSs.

발행기관:
대한경영학회
분류:
경영학

AI 법률 상담

이 논문의 주제에 대해 더 알고 싶으신가요?

460만+ 법률 자료에서 관련 판례·법령·해석례를 찾아 답변합니다

AI 상담 시작
머신러닝을 활용한 군특성화고 전문병 선발 예측 및 특성 탐색 | 대한경영학회지 2023 | AskLaw | 애스크로 AI