상업용 부동산 통계 사용자 감정분석 및 토픽모델링
Emotion Analysis and Topic Modeling of Commercial Real Estate Statistics Users
민성훈(수원대학교)
31권 1호, 7~21쪽
초록
전문가를 대상으로 한 인터뷰는 비계량적 경험이나 의견을 심층적으로 파악하기 위해 자주 사용되는 연구방법이다. 그러나 인터뷰 내용을 해석하고 시사점을 도출하는 과정에서 연구자의 주관이나 선입관이 크게 작용하는 단점을 가진다. 이러한 단점을 극복하기 위한 방법 중 하나는 인터뷰 내용 그 자체 즉 텍스트에 충실한 분석기법을 도입하는 것이다. 본 연구는 대표적인 텍스트 분석 기법인 감정분석과 토픽모델링을 사용하여 상업용 부동산 통계의 사용자를 대상으로 진행한 인터뷰를 분석하였다. 그리고 연구자의 주관이나 선입관에 좌우되지 않고 텍스트에 충실하게 내용을 이해하는 데 텍스트분석이 유용한지 살펴보았다. 첫째, 인터뷰 이후 필자는 통계의 사용자들이 부정적 의견 즉 불만을 많이 토로한 것으로 인식하였다. 그러나 감정분석 결과 부정적 발언도 있었지만, 중립적 발언이 가장 큰 비중을 차지한 것을 알 수 있었다. 이는 상업용 부동산 통계에 대한 필자의 부정적 감정이 사용자의 부정적 발언에 더 주목하게 했다는 것을 암시한다. 둘째, 토픽모델링에서는 공공부문의 역할, 리테일 통계의 고려요소, 상업용 부동산 통계의 문제, 통계의 활용성, 상권설정과 표본선정 다섯 가지 토픽이 추출되었는데, 여기서도 필자의 인식과 다른 세 가지 차이가 발견되었다. 1) 공공부문의 역할에 대해 필자는 공공데이터 개방에 대한 요구를 강하게 인식했는데, 실제로는 공공통계의 확대에 대한 의견도 적지 않았다. 2) 표본선정과 권역설정에 대해 필자는 두 토픽이 별도로 논의되었다고 인식했는데, 실제로는 매번 함께 논의되었다. 이는 두 문제가 실무적으로 깊게 연관되어 있음을 나타낸다. 3) 리테일 통계와 관련된 이슈가 전체 인터뷰에서 가장 중요하고 빈번하게 논의되었다. 필자가 오피스와 같이 다른 내용에 집중하는 동안에도 인터뷰 대상자들은 리테일의 특수성과 그것이 통계에 미치는 영향을 끊임없이 알려주고 있었던 것이다. 이러한 차이를 인지한 후 다시 인터뷰 내용을 읽었을 때 필자의 초기 해석에 주관과 선입관이 영향을 미쳐 텍스트를 있는 그대로 이해하지 못했다는 것을 확인할 수 있었다. 이를 통해 텍스트분석이 인터뷰와 같은 연구방법을 사용하는데 유용한 보조수단이 된다는 것을 알 수 있다.
Abstract
Interviews with experts are frequently employed as a research method to gain in-depth insights into non-quantifiable experiences and opinions. However, a major limitation of this approach is that researchers’ subjectivity and preconceptions can significantly influence the interpretation of interview content and the derivation of implications. One way to overcome this limitation is to adopt analytical techniques that remain faithful to the text itself. This study applies Emotion Analysis and Topic Modeling, two representative text analysis techniques, to examine interviews conducted with users of commercial real estate statistics. The study investigates whether text analysis serves as a useful tool for comprehending interview content in an objective manner, independent of researchers’ biases. First, after conducting the interviews, I initially perceived that users of commercial real estate statistics frequently expressed dissatisfaction. However, Emotion Analysis revealed that while some negative remarks were present, neutral statements constituted the largest proportion. This finding suggests that my own negative perception of commercial real estate statistics led me to focus more on users’ critical remarks. Second, Topic Modeling extracted five key topics from the interviews: the role of the public sector, considerations for retail statistics, issues with commercial real estate statistics, the utility of these statistics, and commercial districts and sample selection. Notably, three key discrepancies emerged between my initial perceptions and the results of the text analysis. (1) Regarding the role of the public sector, I strongly perceived that users primarily demanded greater openness in public data. However, the analysis revealed that many participants also expressed support for expanding public statistics. (2) I initially believed that sample selection and commercial district were discussed as separate topics, but the results showed that they were consistently addressed together, indicating their deep interconnection in practice. (3) Retail-related statistical issues were the most frequently and prominently discussed topic throughout the interviews. While I had focused on other aspects, such as office statistics, interviewees continuously emphasized the unique characteristics of retail and their implications for statistical methodologies. Upon recognizing these discrepancies, I revisited the interview transcripts and confirmed that my initial interpretations had been influenced by personal biases and preconceptions, preventing me from fully grasping the content as presented in the text. This study thus demonstrates that text analysis can serve as a valuable supplementary tool for research methods involving interviews, enhancing objectivity in data interpretation.
- 발행기관:
- 한국부동산분석학회
- 분류:
- 경제학