온라인 기반 부동산 심리지수(Real Estate Sentiment Index)의 개발과 아파트 매매가격 반응 분석- 머신러닝 예측과 Shapley Additive Explanations 해석을 활용한 접근 -
Development of an Online Real Estate Sentiment Index and Analysis of Apartment Price Responses - A Machine Learning Prediction and Shapley Additive Explanations Interpretation Approach -
박순미(대구대학교); 이성화(대구대학교)
11권 2호, 81~104쪽
초록
본 연구는 감성 분석 기반 비정형 데이터를 활용하여 온라인 실시간 부동산 심리지수(real estate sentiment index, RSI)를 구축하고, 이를 전국 아파트 매매가격지수와 연계해 기존 설문조사 기반 지표(consumer sentiment index, CSI)와 비교 · 분석하였다. 분석자료는 2016년 1월부터 2024년 12월까지의 월간 데이터를 활용하였으며, 감성분석은 KoBERT 기반 KR-FinBert-SC 모델을 적용하였다. RSI는 중립 문서를 softmax 확률값 기준으로 극성 재분류한 뒤, 긍·부정 문서 수 차이를 지표화해 산출하였다. 실증분석에는 단변량 회귀, Granger 인과성 검정, random forest, SHAP (Shapley additive explanations), 공적분 회귀모형을 적용하였다. RSI는 CSI 대비 설명력(R²=0.4359 vs0.0079)과 예측력(root mean squared error 및 mean absolute error 기준)에서 우수했고, 시차 2~3개월에 유의한 인과성이 확인되었다. 또한 금리 충격기 및 16개 가격 변곡점 모두에서 RSI가 선행 반응하였다. SHAP 분석에서도 RSI는 낮은 값에서 음의, 높은 값에서 양의 영향력을 보이며 비선형성과 정량적 기여를 입증하였다. 이는 RSI 기반조기경보체계 구축과 넛지정책 활용, 정책지표 제도화 가능성을 시사한다.
Abstract
This study develops an online real estate sentiment index (RSI) using unstructured textual data and compares its explanatory power with that of the traditional survey-based index (CSI) in predicting apartment prices in Korea. The analysis employs monthly data from January 2016 to December 2024. Sentiment classification is performed using the KR-FinBert-SC model, built on KoBERT. The RSI is constructed by reclassifying neutral documents based on softmax probabilities and computing the difference between the number of positive and negative documents. The empirical methods employed include univariate regression, Granger causality tests, random forest modeling, Shapley additive explanations (SHAP) analysis, and co-integration-based regression. Results indicate that the RSI significantly outperforms the CSI in both explanatory power (R²=0.4359 vs. 0.0079) and predictive accuracy. Granger causality tests show a statistical relationship significant with a 2‒3 month lag. The RSI also exhibited leading behavior at all 16 identified price turning points, including those driven by interest rate shocks. SHAP analysis confirmed the RSI’s nonlinear influence and structural contribution to price prediction. Overall, the RSI demonstrates strong potential as an early warning indicator, a behavioral policy tool, and a complement to macroeconomic variables by providing a real-time, emotion-sensitive measure of market sentiment.
- 발행기관:
- 한국부동산원
- 분류:
- 부동산경제