대형 언어 모델을 활용한 기업데이터 분석: ChatGPT를 활용한 직원 이직 예측
Leveraging LLMs for Corporate Data Analysis: Employee Turnover Prediction with ChatGPT
김성민(서울과학종합대학원대학교); 정지용(덕성여자대학교)
25권 2호, 19~47쪽
초록
기업의 데이터 분석 및 활용 역량은 전사 차원의 지식경영과 의사결정에 중요한 역할을 한다. 이 연구는 대형 언어 모델이 기업데이터 분석에서 어떻게 활용될 수 있는지 알아보고자 수행되었다. 구체적으로 인적자원 분야에 초점을 맞추 어, 대형 언어 모델의 데이터 분석 역량을 검증해 보았다. 이를 위해 인사분야에서 많은 연구가 이루어져온 공개데이터 셋 IBM HR 데이터를 소재로, 선행연구들에서 이루어진 머신러닝 기반 이직자 예측 분석을 ChatGPT를 통해 재현하고 그 예측성능을 비교해보았다. 고급 프로그래밍 역량이 필요했던 과거 연구방식과 달리, 분석가의 자연어 요청으로 진행 한 ChatGPT 기반 머신러닝 데이터 분석은 훨씬 쉽고 빠르다는 장점이 있었고, 예측 정확도 역시 선행연구와 비교해 경 쟁력 있는 수준을 기록했다. 이는 그동안 고급 프로그래밍 역량이 요구되던 기업데이터 분석 분야에서, ChatGPT를 비롯 한 대형 언어 모델들이 효과적이고 실질적인 대안이 될 수 있다는 가능성을 시사한다. 또한 이를 통해 데이터 분석의 대 중화 나아가 데이터 기반 의사결정(DDDM: Data-Driven Decision Making)의 확산에도 기여할 수 있을 것으로 기대된다. 데이터분석 과정에서 사용한 프롬프트와 ChatGPT가 생성한 프로그래밍 코드도 부록에 수록하여 검증 가능하게 함으로써, 향후 대형 언어 모델을 활용한 데이터분석 연구의 초석을 제공하고자 한다.
Abstract
Organizational ability to analyze and utilize data plays an important role in knowledge management and decision-making. This study aims to investigate the potential application of large language models in corporate data analysis. Focusing on the field of human resources, the research examines the data analysis capabilities of these models. Using the widely studied IBM HR dataset, the study reproduces machine learning-based employee turnover prediction analyses from previous research through ChatGPT and compares its predictive performance. Unlike past research methods that required advanced programming skills, ChatGPT-based machine learning data analysis, conducted through the analyst's natural language requests, offers the advantages of being much easier and faster. Moreover, its prediction accuracy was found to be competitive compared to previous studies. This suggests that large language models could serve as effective and practical alternatives in the field of corporate data analysis, which has traditionally demanded advanced programming capabilities. Furthermore, this approach is expected to contribute to the popularization of data analysis and the spread of data-driven decision-making (DDDM). The prompts used during the data analysis process and the program code generated by ChatGPT are also included in the appendix for verification, providing a foundation for future data analysis research using large language models.
- 발행기관:
- 한국지식경영학회
- 분류:
- 경영학