RAR-Agent: 법률 질의응답을 위한 근거 보강형 검색 시스템
RAR-Agent: A Rationale-Augmented Retrieval Framework for Legal Question Answering
김규형(큐아이); 도윤혁(큐아이); 송준현(큐아이); 유자양(경기대학교 글로벌비즈니스학과)
31권 2호, 51~64쪽
초록
대규모 언어 모델의 환각 및 지식 노후화 문제는 법률, 의료와 같은 사실적 정확성이 필수적인 전문도메인에서의 신뢰도와 활용성을 저해한다. 이러한 문제를 완화하기 위한 접근으로, RAG(Retrieval-Augmented Generation)가 제안되었지만, 법률 도메인의 어휘적 불일치로 인하여 높은 관련성을 지닌 외부 지식을 정확히 탐색하지 못하는 한계가 존재한다. 이를 보완하기 위한 Query Formulation 기반의 연구들이 다수 등장하였으나, 추가적인 학습 비용과 검색 단계에서 발생하는 환각문제는 여전한 과제로 남아있다. 본 연구에서는 기존 연구들의 한계를 극복하기 위한 RAR-Agent를제안한다. RAR-Agent는 Chain-of-Thought와 Rationale 기반의 Query Formulation 기법, 그리고 Reciprocal Rank Fusion 및 Reranker 기반 필터링 메커니즘을 활용하여 어휘적 불일치 문제를 완화하고 검색 단계의 환각을 효과적으로 억제한다. 또한, 에이전트의 사실적 정확성을 정밀하게 측정하기 위해, KL-BQA 벤치마크를 구축하였고, KL-BQA 및 KL-RQA 벤치마크 모두에서 우수한 성능을 달성하였다.
Abstract
Hallucination and outdated knowledge in large language models critically undermine their reliability and applicability in specialized domains such as law and medicine, where factual accuracy is essential. While Retrieval-Augmented Generation (RAG) has been proposed as a mitigation strategy, its effectiveness in the legal domain is often hindered by lexical mismatches, which impede the accurate retrieval of highly relevant external knowledge. Although several studies have explored query formulation–based approaches to address this issue, additional training costs and hallucination during the retrieval phase remain persistent challenges. In this paper, we propose RAR-Agent (Rationale-Augmented Retrieval Agent) to overcome these limitations. RAR-Agent employs a Chain-of-Thought and Rationale-based query formulation technique, combined with a Reciprocal Rank Fusion and Reranker-based filtering mechanism, to alleviate lexical mismatch problems and effectively suppress hallucination during retrieval. Furthermore, to precisely evaluate the agent’s factual accuracy, we constructed the KL-BQA (Korean Legal Binary Question-Answering) benchmark. The proposed model achieved superior performance on both the KL-BQA and KL-RQA benchmarks.
- 발행기관:
- 한국컴퓨터정보학회
- 분류:
- 컴퓨터학