애스크로AIPublic Preview
← 학술논문 검색
학술논문경영과 정보연구2025.12 발행

LDA 토픽모델링을 활용한 비정형 텍스트 데이터 기반의 관광 이슈 분석

Analysis of Tourism Issues based on Unstructured Text Data Using LDA Topic Modeling

노윤호(부산대학교); 옥석재(부산대학교)

44권 4호, 119~133쪽

초록

[연구목적]본 연구의 목적은 뉴스 텍스트 데이터를 활용하여 부산 해운대 지역의 관광 이슈를 주제별로 구조화하고, 그 의미적 관계를 확인하는 것이다. 비정형 텍스트 데이터를 활용함으로써 전통적인 수치 기반의 접근 방식을 넘어 관광 이슈의 사회적 관심과 이슈 구조를 정량적으로 파악하고자 하였다. [연구방법]연구 대상 지역은 국내 유명 관광지로 알려진 부산광역시 해운대구로 설정하였으며, 한국언론진흥재단의 BigKinds 플랫폼에서 2010년 1월 1일부터 2024년 12월 31일까지의 뉴스 기사 데이터를 수집하였다. 총 157,377건 중 ‘관광’ 관련 키워드를 포함한 13,295건을 선별하여 분석하였으며, 전처리 과정에서 불용어 제거, 중복 기사 필터링, 형태소 분석을 수행하였다. 이후 Python 환경에서 LDA 토픽모델링을 적용하여 최적의 토픽 수를 산정하고, 관광 관련 주요 주제와 키워드의 분포를 추출하였다. [연구결과]분석 결과 총 11개의 핵심 주제가 도출되었으며, 이는 부산 해운대구 관광이 어떤 구조적 특성과 사회적 관심 속에서 형성되어 왔는지를 보여준다. 각 토픽은 해운대 지역에서 반복적으로 등장한 주요 이슈를 반영하고 있으며, 관광이 단순한 방문 활동을 넘어 도시정책, 지역 산업, 문화 활동과 긴밀하게 연계되어 있음을 시사한다. 특히 지역개발, 산업정책, 문화콘텐츠, 스마트도시 등 다양한 영역이 동시에 나타나며, 해운대 관광의 다층적이고 복합적인 성격을 드러낸다. [연구의 시사점]본 연구는 기존의 정형 데이터 중심 관광 연구를 보완하여, 뉴스 텍스트라는 비정형 데이터를 통해 관광 이슈의 구조를 정량적으로 제시하였다는 점에서 방법론적 기여를 가진다. 또한 분석 결과는 수립, 도시계획, 지역 마케팅 전략, 스마트 관광도시 조성 등 다양한 분야에서 데이터 기반의 의사결정을 지원하는 기초 자료로 활용될 수 있다.

Abstract

[Purpose] The purpose of this study is to structure tourism issues in Haeundae district, Busan city by subject using news text data, and to confirm their semantic relationship. By using unstructured text data, we tried to quantitatively grasp the social interest and issue structure of tourism issues beyond the traditional numerical-based approach. [Methodology]The target area of analysis was Haeundae district in Busan city, South Korea. News articles published between January 1, 2010, and December 31, 2024, were collected from the BigKinds platform provided by the Korea Press Foundation. Among a total of 157,377 articles, 13,295 containing tourism-related keywords were selected for analysis. The preprocessing stage involved removing stopwords, filtering duplicate articles, and performing morphological analysis. Subsequently, Latent Dirichlet Allocation (LDA) topic modeling was applied in a Python environment to extract the distribution of major tourism-related topics and keywords, and the optimal number of topics was determined. [Findings]As a result of the analysis, a total of 11 key themes were derived, which shows what structural characteristics and social interests have been formed in Haeundae-gu, Busan. Each topic reflects major issues that have repeatedly emerged in the Haeundae area, suggesting that tourism is closely linked to urban policy, local industry, and cultural activities beyond simple visit activities. In particular, various areas such as regional development, industrial policy, cultural contents, and smart cities appear at the same time, revealing the multi-layered and complex characteristics of Haeundae tourism. [Implications]This study provides methodological contributions by complementing traditional quantitative tourism research through the use of unstructured news text data to present the structural characteristics of tourism issues in a measurable form. The findings can serve as a foundational resource for data-driven decision-making in various fields, including tourism policy development, urban planning, regional marketing strategies, and the establishment of smart tourism cities.

발행기관:
대한경영정보학회
분류:
경영학

AI 법률 상담

이 논문의 주제에 대해 더 알고 싶으신가요?

460만+ 법률 자료에서 관련 판례·법령·해석례를 찾아 답변합니다

AI 상담 시작
LDA 토픽모델링을 활용한 비정형 텍스트 데이터 기반의 관광 이슈 분석 | 경영과 정보연구 2025 | AskLaw | 애스크로 AI