지식증류 기술에 대한 지식재산법적 관점에서의 검토
A Review of Knowledge Distillation Technology from an Intellectual Property Law Perspective
문명섭(한국지식재산연구원)
20권 4호, 131~146쪽
초록
혁신적인 AI 모델 딥시크(DeepSeek)는 저비용·고효율 모델로 주목받으며 글로벌 AI 산업에 큰 영향을미치고 있다. 딥시크는 전문가 혼합 방식, FP8 기술, 지식증류(Knowledge Distillation) 등을 활용하여하드웨어 비용과 개발 시간을 절감하면서도 선도 기업의 모델과 유사한 성능을 보였으며, 딥시크의 성공 이후 비용 효율적인 AI 모델 개발을 위한 지식증류에 대한 관심이 급증하였다. 이러한 지식증류 기술은 대형 모델(교사 모델)의 지식을 소형 모델(학생 모델)로 이전하는 방식으로, AI 모델의 경량화와추론 속도 향상에 기여하고 있다. 그러나 이 과정에서 지식재산권 관련 논란이 심화되고 있다. OpenAI, 구글 등 선도 기업들은 딥시크가 자신들의 모델을 무단으로 학습하는 등 지식재산을 도용했다고 주장하며 법적 분쟁의 가능성을 제기하기도 하였다. 그동안 AI 모델 개발과 관련된 지식재산 이슈는 AI 모델의 학습과정에서 발생하는 저작권 침해 이슈가 중심이었으나, 후발주자들의 선두그룹 AI 모델을 대상으로 학습하는 지식증류 기술로 인해 데이터 도용 이슈로 확대되고 있다. 지식증류는 후발주자의 경쟁력 확보에 중요한 수단으로 부각되는 동시에, 지식재산 침해 행위에 해당하는지 여부에 대해 검토가필요한 시점인 이유이다. 이에 본 논문에서는 딥시크를 계기로 지식증류를 둘러싼 글로벌 AI 개발사간 갈등이 심화될 것으로 전망되는 가운데, 딥시크의 데이터 도용 의혹에 대해 지식재산법적인 관점에서 검토를 하였다.
Abstract
The emergence of the innovative AI model DeepSeek, a low-cost and high-efficiency model, is having a significant impact on the global AI industry. By utilizing technologies such as the Mixture of Experts, FP8, and Knowledge Distillation, DeepSeek has successfully reduced hardware costs and development time while demonstrating performance comparable to that of leading models. Following DeepSeek's success, interest in knowledge distillation for developing cost-efficient AI models has surged. Knowledge distillation is a technique that transfers knowledge from a large-scale "teacher" model to a smaller "student" model, contributing to model lightweighting and faster inference speeds. However, this process has intensified intellectual property disputes. Leading companies like OpenAI and Google have accused DeepSeek of intellectual property theft, claiming it illegally trained on their models, and have raised the possibility of legal action. Previously, IP issues in AI development primarily focused on copyright infringement during the training process, but with fast-followers using knowledge distillation on models from leading groups, the issue is now expanding to data misappropriation. As knowledge distillation becomes a crucial tool for latecomers to secure a competitive edge, it also necessitates a review of whether such actions constitute IP infringement. This paper examines the allegations of DeepSeek's data misappropriation from an intellectual property law perspective, given the intensifying conflict among global AI developers surrounding knowledge distillation spurred by the DeepSeek case.
- 발행기관:
- 한국지식재산연구원
- 분류:
- 지적재산권법