PPDM기반 이종 DB 연계를 활용한 출연연 공동연구 효율화 연구
A Study on Efficiency of Collaborative Research Using PPDM-based Heterogeneous DB Linkage
전승표(한국과학기술정보연구원); 이재성(과학기술연합대학원대학교); 서주환(한국과학기술정보연구원); 김근환(한국과학기술정보연구원)
22권 4호, 548~575쪽
초록
빅데이터 분석 환경이 확대되면서 이종 데이터베이스 간의 연계가 활발하게 시도되고 있다. 이런 연 계의 시도 과정에서 고유 식별자 즉 개인정보 활용은 연계의 효율성은 높여주지만, 필연적으로 개인정 보의 노출이나 오남용 문제를 발생시킨다. 본 연구에서는 이런 문제점을 극복하고 이종 데이터베이스를 연계할 수 있는 PPDM(Privacy-Preserving Data Mining) 기술을 활용하여 기술혁신 통계와 재무 통계 자료를 연계하는 방법을 개발하여 제시하고, 제시한 방법이 적절할 수 있는지 평가했다. 본 연구는 이런 PPDM 기반의 이종 데이터베이스 연계 방법을 통해서 유사도 측정 방법에 따른 연계 특성을 규명하였 으며, 이를 활용해서 약 15만여 개 기업 중에서 출연연 공동연구 지원에서 높은 만족도가 기대되는 1,192개의 후보 기업을 발굴했다. 또한 본 연구 결과가 정책 연구에 활용될 수 있는 방법을 예시하기 위해서 출연연 공동연구 지원 대상 집단과 대조군의 3년간 매출액과 영업이익 성과를 비교했다. 본 연 구가 제시한 연구 모형과 결과는 데이터 산업 측면에서 PPDM을 활용한 이종 데이터베이스 연계 활성 화 방안을 제시했다는 측면에서 정책적 기여가 기대되며, 출연연과 공동연구가 기대되는 대상을 데이터 기반으로 도출했다는 측면에서 연구관리의 행정 효율화에 실무적 기여도 기대된다. 또한 PPDM을 활용 한 DB 연계는 정책지원 효과 측정과 같은 연구에도 활용될 수 있다는 측면에서는 학문적 기여도 있다.
Abstract
As the big data analysis environment expands, linkage between heterogeneous databases is actively being attempted. In the process of this linkage, the use of the unique identifier, personal information, improves the efficiency of linkage, but inevitably leads to the problem of exposure or misuse of personal information. In this study, we have developed a method to overcome these problems and link the technical innovation statistics with the financial statistics by using the PPDM technology that can connect heterogeneous databases. This study identified the linkage characteristics of the similarity measurement methods through the PPDM-based heterogeneous database linkage method, and explored 1,192 companies that are expected to be supported by government research institutes. In order to illustrate how the results of this research can be applied to policy research, We compared sales and operating profit performance of the target group and the control group for three years. The research model and results presented in this study show that the policy contribution is expected in terms of suggesting ways to activate the heterogeneous database using PPDM in the data industry, Practical contribution to administrative efficiency of research management is also expected. In addition, there is an academic contribution from the point of view that DB linkage using PPDM can be used for research such as policy support effectiveness measurement.
- 발행기관:
- 한국기술혁신학회
- 분류:
- 기술정책