기술명의 언어적 특성과 기술이전 거래 성과: 스마트 테크브릿지 데이터 분석
Linguistic Characteristics of Technology Names and Technology Transfer Outcomes: An Exploratory Study Using Smart TechBridge Data
이윤정(이화여자대학교); 변진호(이화여자대학교)
14권 3호, 1~39쪽
초록
본 연구는 기술이전 시장에서 기술명의 언어적 특성과 거래 성과 간의 연관성을 탐색적으로 분석하였다. 기술이전 과정에서 정보 비대칭성은 거래의 주요 장애 요인이며, 기술명은 기술 정보를 압축적으로 전달하는 핵심 요소이다. 그러나 기존 연구는 기술의 특성이나 조직 역량에 초점을 맞추었을 뿐, 기술명과 같은 언어적 요소의 영향은 충분히 탐구되지 않았다. 본 연구는 기술보증기금 기술매칭 플랫폼인 '스마트 테크브릿지'의 2021-2024년 공공데이터 97,334건(거래성사 2,668건, 미거래 94,666건)을 분석하였다. 한국어 자연어처리 기법을 활용하여 길이, 어절수, TTR(Type-Token Ratio), 문자 구성, 형태소 구성 등 12개의 언어적 복잡도 지표를 산출하고, t-검정, 로지스틱 회귀, 머신러닝 분석을 통해 거래성사 그룹과 미거래 그룹 간 차이를 비교하였다. 분석 결과, 12개 변수 중 9개에서 통계적으로 유의한 차이가 관찰되었다. 효과크기 기준으로 Small 수준(|d|≥0.2) 이상의 효과를 보인 변수는 한글비율(d=-0.240), 평균어절길이(d=+0.226), 어절수(d=-0.222)였다. 거래성사 기술명은 미거래 기술명에 비해 형식적으로 간결하고(어절수 7.57 vs 8.43), 단위 어절당 정보 밀도가 높으며(평균어절길이 3.05 vs 2.89), 어휘 반복과 수식어 사용이 적은 특징을 보였다. 로지스틱 회귀 분석에서는 어절수(OR=0.81, p<.001), 평균어절길이(OR=1.08, p<.001), TTR(OR=1.10, p=.002) 등이 통계적으로 유의한 것으로 나타났다. 머신러닝 분석에서는 랜덤포레스트 모델이 AUC 0.630으로 가장 높은 예측 성능을 보였으나, 이는 제한적인 수준으로 기술명만으로 거래 성과를 예측하는 데 한계가 있음을 시사한다. 구간분석에서는 어절수 4개 이하 구간의 거래성사율(3.33%)이 13개 이상 구간(1.55%) 대비 약 2.1배 높은 것으로 관찰되었다. 본 연구는 기술이전 연구에 언어적 관점을 도입하고, 대규모 데이터에서 기술명의 언어적 특성과 거래 성과 간의 체계적인 연관성을 확인하였다는 점에서 학술적 의의가 있다. 특히 t-검정, 로지스틱 회귀, 머신러닝, 구간분석에서 일관된 방향성이 확인되어 방법론적 수렴을 달성하였다. 다만, 효과크기가 Small 수준이고 예측 모델의 설명력이 제한적(AUC 0.630, Pseudo R²=0.014)이므로 기술명만으로 거래 성과가 결정된다고 볼 수 없다. 본 연구는 기술명 특성과 거래 성과 간의 연관성을 탐색한 초기 연구로서, 향후 인과관계 검증을 위한 후속 연구가 필요하다.
Abstract
This study explored the association between linguistic characteristics of technology names and transaction outcomes in the technology transfer market. Using 97,334 cases from the 'Smart TechBridge' platform (2021-2024), 12 linguistic complexity indicators were computed through Korean natural language processing. Differences between successful and unsuccessful transaction groups were compared through t-tests, logistic regression, machine learning, and interval analysis. Results showed statistically significant differences in 9 of 12 variables. Successful transaction names were more concise (7.57 vs 8.43 words) and had higher information density per word (3.05 vs 2.89). Logistic regression indicated that number of words (OR=0.81, p<.001) and average word length (OR=1.08, p<.001) were statistically significant. The Random Forest model achieved an AUC of 0.630, indicating limited predictive power. Interval analysis showed that names with 4 or fewer words were observed to have 2.1 times higher transaction rates compared to those with 13 or more words. This study contributes by introducing a linguistic perspective to technology transfer research, with methodological convergence across four analytical methods. However, given Small effect sizes and limited predictive power (AUC 0.630, Pseudo R²=0.014), technology names should be understood as one of many factors associated with transaction outcomes. As an early exploratory study, further research is needed to verify causal relationships.
- 발행기관:
- 기술보증기금
- 분류:
- 기업/산업/기술경영