RAG-LLM 기반 KLIPS 지식 챗봇 개발
Developing a Knowledge Chatbot for KLIPS: Based on RAG-LLM Model
민인식(경희대학교)
25권 3호, 139~164쪽
초록
본 연구는 한국어 특화 AI 모델인 EXAONE 4.0 모델을 활용하여 한국노동패널(KLIPS) 전문 지식탐색을 위한 검색증강생성(RAG) 챗봇을 개발하였다. 해당 모델을 Google Gemini와 Chat GPT 등 최신 글로벌 LLM과 비교 분석하는 것을 목적으로 한다. KLIPS 공식 문헌으로 구축된 지식베이스와 EXAONE 4.0(1.2B) 모델을 결합한 RAG-LLM 시스템을 설계한 후, KLIPS 사용자의 실제 분석 환경인 Stata에서 사용가능하도록 smart_klips_exaone 모듈을 개발하였다. 벤치마크 질의응답 비교 결과, 답변의 범용성ㆍ유창성 측면에서 글로벌 모델이 일부 우세를 보였으나, KLIPS 고유 용어의 재현 정확성과 환각 억제 능력에서는 RAG- EXAONE 모델이 우위를 나타냈다. 이는 전문 연구지원 도구의 핵심 효용성이 사실적 정확성과 안전성에 있음을 고려할 때 본 연구에서 제시한 모델이 실제 연구환경에서 실용적 가치를 지닐 수 있음을 시사한다. 또한 본 연구는 지식베이스를 점진적으로 고도화하는 ‘인간-AI 협업 기반 선순환 구조’를 향후 발전 방향으로 제시하였다.
Abstract
This study develops a Retrieval-Augmented Generation(RAG) chatbot for specialized knowledge retrieval on the Korean Labor & Income Panel Study(KLIPS), using the Korean-specific AI model, EXAONE 4.0. The main purpose is to compare its performance against leading global LLMs such as Google Gemini and ChatGPT. We designed a RAG-LLM system that combines a knowledge base built from official KLIPS documentation with the EXAONE 4.0(1.2B) model, and developed the smart_klips_exaone module to ensure its usability within Stata. Benchmark Q&A comparisons revealed that while global models exhibited some superiority in general fluency, the RAG-EXAONE model demonstrated a distinct advantage in the accurate reproduction of KLIPS-specific terminology and in hallucination suppression. Considering that the utility of a professional research support tool lies in factual accuracy and safety, this finding suggests that the model proposed in this study may hold higher practical value in a real research environment. Furthermore, this study proposes a ‘human-AI collaborative virtuous cycle’ as a future direction for progressively enhancing the knowledge base.
- 발행기관:
- 한국노동연구원
- 분류:
- 사회과학일반