애스크로AIPublic Preview
← 학술논문 검색
학술논문부동산분석2025.07 발행

RAG-LLM(Retrieval Augmented Generation-Large Language Model) 기반 부동산 뉴스 분석을 통한 아파트 매매가격지수 예측 모델 개발

Predicting Apartment Price Indices through Real Estate News Analysis: A Retrieval Augmented Generation-Large Language Model (RAG-LLM) Approach

김진우(고려대학교); 은준엽(고려대학교)

11권 2호, 105~130쪽

초록

본 연구는 검색증강생성(retrieval augmented generation, RAG) 기반의 대규모 언어모델(large language model, LLM)이 부동산 분야의 비정형 빅데이터를 효과적으로 처리하여 유용한 전망을 생성함을 보였다. LLM을 전문적인 외부 지식과 연결하는 RAG는 환각 현상을 줄이고 신뢰할 수 있으면서 분야에 특화된 답변을 생성할 수 있다. 연구에서는 비정형 빅데이터인 부동산 뉴스 기사를 활용하여 RAG-LLM을 구축하고 서울 아파트매매가격 변동에 대한 전망 점수를 생성하였다. 2015년부터 2024년까지 10년에 걸쳐 생성된 전망 점수는 가격 변화에 선행성을 보였고, 가격 방향성 예측에서 시계열 모형 대비 11% 향상된 85%의 정확도와 93%의 AUC-ROC 성능을 보였다. RAG 과정에서 추론(chain-of-thought) 프롬프팅을 이용하면 더 우수한 품질의 답변을 얻을 수 있었고, 시계열 모델의 외생변수로 활용할 때도 예측 성능의 개선을 보였다. 연구 결과는 RAG-LLM 방법론이 비정형 데이터로부터 복잡한 맥락을 이해하고 지식을 추출할 때 기존 감성분석 방법론의 한계를 극복할 수 있고, 데이터를 유용하게 활용하기 위한 돌파구를 제공할 수 있음을 시사한다. 또한, 이 접근법은 시차 지연 없이 다음 기의 시장 예측을 형성함으로써 투자나 정책 의사결정에 유용한 도구로 활용될 잠재성을 지닌다.

Abstract

This study explores the effectiveness of retrieval augmented generation (RAG) with large language models (LLMs) in processing unstructured data in real estate. By connecting pretrained LLMs with external knowledge sources, the RAG methodology reduces hallucinations while generating reliable domain-specific responses. We construct an RAG-LLM model using real estate news articles to predict directional movements in Seoul apartment price indices. Analysis spanning 2015‒2024 reveals that RAG-LLM predictions serve as significant leading indicators for apartment price changes, achieving 85% accuracy and 93% area under the curve - receiver operating characteristic (AUC-ROC). These RAG-LLM predictions outperform those based on the autoregressive integrated moving average (ARIMA) model by more than 11%. Employing chain-of-thought prompts with RAG further enhances performance, with improved metrics observed when evaluated using ARIMA with exogenous variables. Our findings suggest that the RAG-LLM approach represents a significant advancement in real estate analysis by effectively leveraging unstructured data and overcoming the limitations of traditional sentiment analysis through complex contextual understanding. The RAG-LLM approach also enables near real-time forecasting, significantly boosting its practical utility in real-world applications.

발행기관:
한국부동산원
DOI:
http://dx.doi.org/10.30902/jrea.2025.11.2.105
분류:
부동산경제

AI 법률 상담

이 논문의 주제에 대해 더 알고 싶으신가요?

460만+ 법률 자료에서 관련 판례·법령·해석례를 찾아 답변합니다

AI 상담 시작
RAG-LLM(Retrieval Augmented Generation-Large Language Model) 기반 부동산 뉴스 분석을 통한 아파트 매매가격지수 예측 모델 개발 | 부동산분석 2025 | AskLaw | 애스크로 AI