23년간(1996~2018) 국내학술연구의 ‘고령’ 키워드로 살펴본 빅데이터 분석
A Topic Modeling Analysis from the ‘Aging’ Keyword of Domestic Academic Research
오민정(조선대학교)
48권 2호, 515~532쪽
초록
본 연구는 23년간의 국내 DB에 게재된 국내저널을 중심으로 토픽모델링과 네트워크 분석을 활용해 기존의 고령연구에 대한 관심주제의 주요한 어구들을 발견해내고 이에 대한 빅데이터 분석을 통해 고령연구에 대한 경영학적 시사점을 제시하는데 연구 목적이 있다. 논문 제목에 ‘고령’의 단어를 포함하고 있는 사회과학연구 1291편의 논문을 추출하였으며, 토픽모델링 방법을 사용하여 연구 동향을 파악하였다. 토픽 모델링은 텍스트 본문에 있는 숨겨져 있는 의미를 파악하여 각개별연구의 범위를 줄이면서 전체적인 연구의 초점을 다양한 관점에서 파악할 수 있는 기법으로 인식되고 있다. 이러한 토픽 모델 분석을 통해 5개의 토픽을 확인할 수 있었고 각 토픽별 세부 관심주제를 통해 고령 연구동향과 연구흐름을 명료하게 확인할 수 있었다. 그동안 고령연구가 주로 미시적인 접근에 국한되었다면 본 연구는 보다 거시적인 관점에서 고령연구를 살펴보고 있으며, 논문의 숨겨진 구조를 파악할 수 있는 LDA(Latent Dirichlet Allocation) 접근 방법을 활용하고 있으며, 기존의 연구에서 명확히 확인할 수 없었던 핵심단어에 초점을 둘 수 있었다. 이를 통해 우리는 초록들이 어떤 비율로 어떤 주제를 다루는지 알 수 있었으며 주제의 비율을 통해 주제의 인기도와 흐름 역시 예측할 수 있었다. 또한 LDA분석의 가장 중요한 목적은 ‘연구’ 또는 ‘분석’과 같이 흔하지만 비유익한 명사구를 제거하면서도 중요한 명사구는 유지하는 방법이며 추출된 명사구의 TF-IDF(term frequency-inverse document frequency)를 계산하여 특정 초록에서 가장 많이 사용된 단어를 보여 준 후 빈도의 비율을 제시해주는 것이다. 그 결과 5개의 토픽별로 총 25개의 주요 명사구를 작성할 수 있었다. 이러한 결과를 통해 현재까지 고령연구의 흐름과 앞으로의 고령연구의 방향을 제시하면서 향후 고령에 관한 경영학적 연구에 시사점을 제시하고자 한다.
Abstract
The purpose of this study is to find the main phrases of interest topics in old research by using text mining centering on domestic journals published in the national DB for 23 years. 1327 papers were used in the analysis, and the journal was extracted from the social science research including the word ’aging, old’ in the abstract, and the topic modeling method was used to show trends during that period. The most important aspect of topic modeling is to broaden and diversify the focus of aging research. As a result, five topics were identified, and the research trends and themes were confirmed through each topic. In the past, research on aged research has been limited to a micro-approach, and this study examines aged research with a more macroscopic eye. The methodology is also based on the Latent Dirichlet Allocation (LDA) approach Using analytical methods, we advanced the analysis one step further and focused on core word research that we have not been able to examine in the meantime. Through this, we were able to know what percentage of the abstracts were covered by the abstracts, and the popularity and trends of the topics could also be predicted if we understood the proportion of themes. The most important goal of this analysis is to maintain important noun phrases while removing common but unfavorable noun phrases such as ‘research’ or ‘analysis’, and to calculate the term frequency-inverse document frequency (TF-IDF) of extracted noun phrases, It shows the percentage of frequency after showing the most used words in a specific abstract. As a result, a total of 25 major noun phrases could be created for each of the five topics. Through these results, we will present the trend of aged research and future direction of research.
- 발행기관:
- 한국경영학회
- 분류:
- 경영학