BERT 기반 국내 스타트업-해외 바이어간 B2B 매칭 모델
BERT-based B2B matching model for K-Startups and Overseas Buyers
최정석(호서대학교 융합공학과); 문남미(호서대학교)
24권 9호, 769~775쪽
초록
국내 스타트업이 자사의 시장 확대를 위해 글로벌 시장으로 진출하기 위해서는 적합한 해외 바이어를 효과적으로 발굴하는 작업이 필수적이다. 이에 본 논문은 자연어처리 사전학습 모델인 BERT 기반의 국내 스타트업-해외 바이어간 B2B 매칭 모델을 제안한다. 제안 모델은 국내 스타트업 및 바이어 홈페이지, 상담일지 등에서 수집한 비정형 텍스트 데이터를 입력 데이터로 사용했고, 출력층에서 적합/부적합 파트너를 이진분류하도록 설계했다. 기업정보는 국내 스타트업 2,860개사, 해외 바이어 2,316개사의 데이터를 수집했고, 매칭 정보는 30,456건의 상담데이터 중 긍정 케이스 6,458건(21.2%), 부정 케이스 23,998건(78.8%)의 데이터를 활용했다. 제안모델의 성능평가를 위한 기준모델은 Word2Vec을 양방향 LSTM으로 학습시킨 콘텐츠기반 필터링 모델이다. 실험결과 제안모델은 기준모델에 비해 정확도(1.7%p), 정밀도 (3.1%p), 재현율(5.2%p), f1-score(4.1%p) 등에서 고르게 더 높은 성능을 보여주었다. 국내 스타트업이 이 모델을 활용해 적합한 바이어를 보다 효과적으로 발굴할 수 있을 것이다.
Abstract
For K-Startups to advance into the global market for their business expansion, it is critical to find suitable overseas buyers effectively. This paper proposes a business-to-business (B2B) matching model between K-Startups and overseas buyers based on BERT, a pre-trained NLP model. The proposed model was designed to classify binary classification for right or non-right business partners in the output layer using unstructured text data collected from home pages of K-Startups and overseas buyers and business meeting records. For corporate information, data from 2,860 startups and 2,316 overseas buyers were collected, and for matching information, out of 30,456 business meeting records data, 6,458 positive cases (21.2%), and 23,998 negative cases (78.8%) were used. The base model for evaluating the proposed model is a content-based filtering model trained by bidirectional LSTM with Word2Vec. Based on the experimental results, the proposed model demonstrated better performance compared to the comparative model in accuracy (1.7%p), precision (3.1%p), recall (5.2%p), and f1-score (4.1%p). Using this model, K-Startups can find overseas buyers more effectively.
- 발행기관:
- 한국산학기술학회
- 분류:
- 공학일반