딥러닝 전이학습의 가능성 검토: 부동산 분야를 사례로
Exploring the possibility of transfer learning in deep learning: an application to real estate
이창로(강원대학교)
22권 4호, 663~670쪽
초록
딥러닝 알고리즘을 처음부터 학습시키려면 방대한 데이터를 투입하여야 하므로, 충분한 데이터 확보가 어려운 경우 학습이 어려울 수 있다. 본 연구에서는 데이터 부족 문제를 극복하기 위하여 전이학습(transfer learning)이라는 개념을 부동산 분야에 적용하였다. 정형데이터 처리에 사용되는 신경망 모형인 DNN(dense neural network)을 부동산 가치 추정에 적용한 결과, 전이학습 성과는 양호하지 못한 것으로 나타났다. 또한, 비정형데이터 중 이미지 처리에 특화된 신경망 모형인 CNN(convolutional neural network)을 사용하여 건물 사진을 토대로 대상 부동산의 용도를 분류하였다. 분류 결과는 비교적 양호하여 전이학습의 높은 가능성을 발견할 수 있었다. 정형데이터의 경우, DNN을 구성하는 은닉층의 전이학습 비효율성, 전이학습에 활용된 은닉층 개수가 적었던 점 등에서 성과 부진의 원인을 찾을 수 있다. 반면 사진 자료를 활용한 건물 용도 분류의 경우, CNN을 구성하는 은닉층의 뛰어난 전이학습 효율성, 50개에 달하는 은닉층으로 인해 새로운 과업에 이전시킬 학습된 지식이 풍부하였던 점으로 인해 비교적 양호한 성과를 산출할 수 있었다.
Abstract
It is generally not a good idea to train a deep learning algorithm from scratch because it demands significantly large amount of data. Transfer learning technique is exploited in this study to overcome a sparse data problem in real estate industry. A dense neural network (DNN) is a universal algorithm to process structured data, and was utilized to estimate property price. In this case, the transfer learning did not show acceptable performance. In addition, a convolutional neural network (CNN), an algorithm specialized for unstructured data such as imagery data, was employed to classify a building usage based on the front-view of photographs collected. It was found that the transfer learning of CNN worked relatively well in image classification tasks. For structured data, the poor performance of the DNN could be attributed to the inefficiency of hidden layers and insufficient number of hidden layers used. In contrast, this study attributed excellent performance of the CNN to the efficiency of convolutional layers, and sufficient number of hidden layers used (50 layers).
- 발행기관:
- 한국디지털콘텐츠학회
- 분류:
- 컴퓨터학