공공기술사업화를 위한 트랜스포머 기반특허-기업 매칭 모델 연구
A Transformer-Based Patent–Company Matching Model for Public Technology Commercialization
원민재(연구개발특구진흥재단 성과혁신팀); 정해민(한국교통대학교)
31권 3호, 65~77쪽
초록
공공기술사업화는 공공연구기관의 연구개발 성과를 민간기업에 이전하여 실제 사업으로 연결하는 과정을 의미한다. 이과정의 핵심은 연구기관의 핵심 성과인 특허를, 해당 기술을 필요로 하는 기업과 효과적으로 매칭하는 데 있다. 그러나기존의 협업 필터링은 구조화되지 않은 텍스트 정보 활용에 한계가 있으며, 키워드 기반 분류 방식은 텍스트의 의미적 맥락을 충분히 반영하지 못한다. 본 연구는 이러한 문제를 해결하기 위해, 기업이 수행했던 연구개발 과제 텍스트를 기업의기술 수요를 간접적으로 나타내는 정보로 간주하고, 이를 특허 텍스트와 함께 입력하여 관련성을 계산하는 트랜스포머 기반 특허–기업 매칭 프레임워크를 제안하였다. 구체적으로, 대규모 언어모델을 활용해 형식이 상이한 과제 텍스트를 표준화한 뒤, 트랜스포머 기반 Bi-Encoder 및 Cross-Encoder 구조를 사용하여 특허–과제 텍스트 간 매핑 점수를 산출, 해당점수를 기준으로 특허 수요 기업을 추천하게 된다. 연구개발특구의 공공기술사업화 사례 356건에 대한 실험 결과,CrossEncoder Only 모델이 HR@10 0.9116, MRR 0.7377, nDCG 0.7775로 가장 우수한 성능을 나타냈다. 이는 문맥 간비선형 상호작용을 학습하는 Cross-Encoder 구조가 특허–기업 매칭의 정밀도 향상에 효과적임을 시사한다. 본 연구는 국내 최초로 텍스트 간 점수 계산을 활용하여 특허–기업 매칭 문제를 해결한 사례로서 학문적 의의를 지니며, 향후 다른기술–수요 매칭 분야에도 확장 가능성을 갖는다.
Abstract
Public technology commercialization refers to the process of transferring research and development(R&D) outcomes from public research institutions to private companies, enabling their practical utilizationin industry. A critical step in this process is effectively matching patents―the core intellectual outputs ofresearch institutions―with companies that require the corresponding technologies. However, conventionalcollaborative filtering approaches are limited in leveraging unstructured textual information, andkeyword-based classification methods often fail to capture the full semantic context of text. To addressthese limitations, this study proposes a transformer-based patent–company matching framework that treatsthe textual descriptions of R&D projects previously conducted by companies as an indirect representationof their technological demands. These project texts are standardized using a large language model (LLM)to unify diverse formats, after which both patent and project texts are encoded using transformer-basedBi-Encoder and Cross-Encoder architectures to compute mapping scores. Based on these scores, companieslikely to demand the given patents are recommended. Experiments on 356 real-world cases of publictechnology commercialization in Korea demonstrated that the Cross-Encoder Only model achieved the bestperformance, with HR@10 of 0.9116, MRR of 0.7377, and nDCG of 0.7775. These results indicate thatthe Cross-Encoder architecture, which captures nonlinear contextual interactions, is effective in improvingthe precision of patent–company matching. As the first domestic study to apply cross-textual scoring forthis problem, this research holds academic significance and offers potential for extension to other domainsof technology–demand matching.
- 발행기관:
- 한국지능정보시스템학회
- 분류:
- 산업공학