AI 학습용 데이터의 특허 보호 방안
The Patentability of AI Training Data: Legal Challenges and Policy Implications
엄태민(특허청)
15권 1호, 1~43쪽
초록
이 글은 청구항의 말미에 발명의 카테고리로 기재된 「…데이터」, 「…데이터셋」 또는 「…데이터구조」가 특허법 상 물건발명의 카테고리로 특정될 수 있는 것인지를 검토하고, 데이터의 생성·수집·전송·저장·관리 방법 및 시스템(장치), 수집된 데이터의 특성 분석을 통해 AI 학습용으로 가공한 데이터셋(구조)의 특허보호 방안을 제언하고자 작성되었다. 데이터 그 자체는 자연법칙을 이용한 기술적 사상(아이디어)가 아니어서 특허의 보호 대상이 아니나, 데이터가 정보처리의 기술적 수단과 결합되어 청구범위의 하나의 구성요소로 특정되는 경우에는 특허로 보호를 받을 수 있어서 최근 관련 특허출원이 급증하고 있다. 특허청의 기술분야별 심사실무가이드에는 「…데이터기록매체」 청구항만 물건발명으로 인정하고 있고, 청구항의 말미에 「…데이터셋(구조)」라고 기재한 경우에도 물건발명으로 볼 수 있는 것인지에 대해서는 명확한 기준을 제시하고 있지 않다. 실무상 혼란 방지를 위해 「…데이터기록매체」 청구항 이외 「…데이터셋(구조)」 청구항도 물건발명으로 인정하되, 미국, 일본 및 유럽연합도 인정하지 않는 「…데이터」와 일본만 인정하고 있는 「…구조를 가진 데이터」 청구항은 물건발명으로 인정하지 않음을 기술분야별 심사실무가이드에 명시할 필요가 있다.
Abstract
This article explores the evolving legal framework governing the patentability of AI training data—a critical asset whose importance has grown in tandem with advances in artificial intelligence (AI). In the AI context, data functions not merely as an informational resource but as a core enabler of technological innovation through processing, analysis, and machine learning applications. While data may be protected under copyright law or trade secret regimes, it generally falls outside the scope of patentable subject matter, as it does not inherently involve the application of natural laws. However, when data is integrated with technical means—such as specific algorithms or processing mechanisms—and is concretely defined as a claim element, it may be eligible for patent protection. This legal gray area has led to a surge in patent applications seeking to capture data-centric inventions. To secure protection, applicants have increasingly adopted claim formats including terms such as “…data,” “…dataset,” “…data structure,” “…structured data,” and “…data storage medium.” Among these, the Korean Intellectual Property Office (KIPO) currently recognizes only “data storage medium” claims as product inventions under its Technical Examination Practice Guide, offering no explicit guidance on the eligibility of “dataset” or “data structure” claims. This lack of clarity has led to inconsistent examination outcomes and growing legal uncertainty. To resolve these challenges, this article advocates for the revision of the Guide to explicitly recognize “dataset” and “data structure” claims as eligible product inventions when they satisfy the requisite technical criteria. At the same time, it should clarify that claims directed solely to “data”—which are not considered product inventions in jurisdictions such as the United States, European Union, or Japan—or to “structured data” (recognized only in Japan), do not satisfy the requirements for patentable subject matter in Korea.
- 발행기관:
- 법학연구소
- 분류:
- 법학