AI 학습을 위한 저작물 이용은 공정이용인가 - Bartz, Kadrey, Ross 판결을 중심으로 -
Fair Use in AI Training: Lessons from Bartz, Kadrey, and Ross
이상용(건국대학교)
113호, 131~183쪽
초록
본 연구는 최근 미국 하급심 판결들의 쟁점을 중심으로 저작물의 AI 학습 이용이 미국 저작권법상 공정이용에 해당하는지를 분석한다. 분석에 앞서 학습 단계 이용의 공정이용 판단에서 생성 단계까지 고려할 것인지 검토할 필요가 있다. 범용 생성 AI 시스템의 경우 양 단계를 분리하여 판단하여야 하나, 특정 목적 AI 시스템의 경우 생성 단계까지 함께 고려할 수 있다. 제1요소(이용의 목적과 성격)에서 AI 학습은 통계적 패턴 추출을 위한 비표현적 이용으로서 변형성이 인정되며, 상업성은 제한적 의미를 갖는다. 불법 복제물 이용의 악의성은 미국법상 결정적 요소가 아니나, 데이터 탈취 등 법질서 전체의 관점에서 위법한 경우 공정이용 판단에 반영될 수 있다. 제2요소(저작물의 성격)는 공정이용 판단에서 제한적 역할을 한다. 제3요소(이용된 양)에서 저작물 전체 이용은 변형적 목적에 비추어 합리적이며, AI 시스템이 학습한 내용 중 외부로 재현되는 부분이 극히 제한적이므로 공정이용에 불리하게 작용하지 않는다. 가장 중요한 제4요소(시장 영향)는 세 가지 측면에서 검토된다. 첫째, 학습데이터 시장의 대가 손실은 현실적 시장이 부재한 상황에서 순환 논리에 불과하다. 둘째, 범용 AI의 생성 단계 직접적 수요 대체는 공정이용 판단에서 고려할 필요가 없으며 실제로도 발생하지 않는다. AI 모델은 통계적 패턴만을 학습하고 상용 시스템에는 필터링 조치가 되어 있어 원저작물과 동일한 산출물 생성이 어렵기 때문이다. 셋째, 시장희석에 의한 간접 대체는 수요 '대체'가 아닌 경쟁에 의한 수요 '감소'에 불과하다. 이를 인정할 경우 저작권자에게 장르 시장 전체에 대한 독점권을 부여하는 결과가 되나, 저작권법은 경쟁을 허용하며 변형적·비표현적 이용으로 인한 시장 감소를 인식 가능한 피해로 보지 않는다. 아울러 AI 기술의 혁신과 창작 촉진이라는 공익도 함께 고려되어야 한다. 이러한 요소들을 종합할 때, 범용 생성 AI 시스템의 학습을 위한 저작물 이용은 공정이용에 해당한다.
Abstract
This study analyzes whether the use of copyrighted works for AI training constitutes fair use under U.S. copyright law, focusing on issues addressed in recent U.S. district court decisions. Prior to the analysis, it is necessary to examine whether the output stage should be considered in the fair use assessment of training stage use. For general-purpose generative AI systems, the two stages must be assessed separately, whereas for special-purpose AI systems, the output stage may be considered together with the training stage. Regarding the first factor (purpose and character of use), AI training qualifies as transformative use, being a non-expressive use for extracting statistical patterns, while commerciality has limited significance. Although bad faith in using pirated copies is not a decisive factor under U.S. law, wrongful conduct such as data theft may be reflected in the fair use determination. The second factor (nature of the copyrighted work) plays a limited role in fair use analysis. For the third factor (amount and substantiality used), the use of entire works is reasonable in light of the transformative purpose, and does not weigh against fair use because the portion of learned content that can be reproduced externally is extremely limited. The fourth factor (market impact), which is the most important, is examined from three perspectives. First, the loss of compensation in the training data market amounts to circular reasoning in the absence of an actual market. Second, direct demand substitution at the output stage of general-purpose AI need not be considered in fair use analysis and does not occur in practice, as AI models learn only statistical patterns and commercial systems have filtering measures that make it difficult to generate outputs identical to original works. Third, indirect substitution through market dilution is merely demand "reduction" due to competition, not demand "substitution." Recognizing this would grant copyright holders a monopoly over entire genre markets, whereas copyright law permits competition and does not regard market reduction from transformative and non-expressive use as cognizable harm. Additionally, the public interest in AI technology's innovation and promotion of creativity must be considered. Considering these factors comprehensively, the use of copyrighted works for training general-purpose generative AI systems constitutes fair use.
- 발행기관:
- 법무부
- 분류:
- 상사법