생성형 인공지능 소프트웨어 개발자의 저작권법상 주의의무에 관한 연구
A Study on the Copyright Law Duty of Care for Generative Artificial Intelligence Software Developers
박정인(덕성여자대학교 AI DynaInfo 연구소); 오성택(덕성여대 대학원 사이버보안학과)
82권, 1~38쪽
초록
본 연구는 생성형 인공지능(Generative AI)의 확산에 따라 제기되는 저작권 침해 문제를 중심으로, 인공지능 소프트웨어 개발자의 주의의무에 대해 검토해 보았다. 즉, 생성형 인공지능 기술의 확산 속에서 인공지능 소프트웨어 개발자의 기술이 저작권법의 어떤 규정을 구체적으로 침해할 수 있으며 이를 학습 단계와 출력 및 유통단계로 구분하여 해석하고자 노력하였다. 현재 우리나라 생성형 인공지능 소프트웨어 개발자는 생성형 인공지능 소프트웨어를 개발함에 있어 어떠한 주의의무를 져야 하는지 상당한 혼란이 존재한다. 이에 대해 생성형 인공지능 소프트웨어 기술의 각 기술 단계별로 저작권 침해 가능성을 살펴보고 이에 대해 가능한 법적 쟁점은 어떤 것이 있을 수 있는지 구체적으로 검토하였다. 다음으로 생성형 인공지능 기술과 저작권의 공존 관계를 모색하고자 우리나라 생성형 인공지능 소프트웨어 개발자가 정교한 법적 접근을 모색하도록 돕기 위해 전통적인 저작권법과 생성형 인공지능 기술에서의 필요한 저작권의 차이를 설명하고자 노력하였다. 첫째, 생성형 인공지능 기술이 학습 단계에서 행하는 데이터 수집·복제 행위가 전통적인 저작권법상 ‘복제’ 개념과 동일시되기 어렵다. 이것은 우리가 가장 주목해야 하는 부분으로 미국 판례법은 Sega, Google Books 판결을 통해, 기능 이해·분석을 위한 중간적 복제(intermediate copying) 와 비표현적 이용(non-expressive use)을 개념화한 바 있으며 이는 공정이용 범주에 해당할 수 있음을 인정해 왔다. 특히 최근 Thomson Reuters v. ROSS Intelligence 사건 역시 생성형 인공지능 학습을 위한 복제가 곧바로 위법하다고 단정될 수 없으며, 그 기술적 구현 방식과 결과물의 성격에 따라 판단되어야 함을 명확히 하였다. 이는 생성형 인공지능 학습 그 자체를 전통적인 저작권 침해 모델로 포섭해야 한다기보다는, 변혁적 목적과 기능적 필요성을 중심으로 평가해야 함을 시사한다. 둘째, 생성형 인공지능 기술에서 사용된 부분의 양과 질은 더 이상 공정 이용 범주에 있어서 기계적으로 불리하게 작동하지 않는다. Authors Guild v. Google 판결에서 확인되듯이, 저작물 전체를 복제하였더라도 그 복제가 변혁적 목표를 달성하는 데 필수적이고, 복제본이 외부에 공개되지 않으며, 출력이 원작을 대체하지 않는 경우에는 공정이용이 인정될 수 있기 때문이다. 이러한 논리는 학습 데이터가 일반적으로 비공개로 유지되는 생성형 인공지능 구조와 밀접하게 맞닿아 있으며, 입력의 광범위함보다 출력의 비대체성이 핵심 판단 요소로 부상하고 있음을 알 수 있다. 셋째, 출력 단계에서는 전통적인 저작권 침해 법리가 여전히 유효하다. 생성형 인공지능 기술이 생성한 결과물이 원저작물에 의거하여 실질적으로 유사한 표현을 재현하거나, 원저작물의 시장을 대체하는 경우에는 공정이용이 부정될 수 있을 것이다. 우리나라 생성형 인공지능 소프트웨어 개발자는 우리나라와 궤를 같이 하는 미국과 같이 TDM 규정도 없고 공정이용 일반조항에 대한 판례의 해석에 의존하는데 이와 같은 미국의 판례를 기다려 해당 주의의무의 시사점을 얻는 것으로는 생성형 인공지능 기술 산업의 발전을 가져올 수 없다. 왜냐하면 비교법적으로 볼 때 입법적 접근의 차이 역시 개발자의 주의의무를 달리 형성하기 때문이다. EU는 DSM 저작권지침의 TDM 예외와 EU AI Act 제53조의 투명성 의무를 통해, 합법적 접근·옵트아웃 존중·요약 공개라는 사전 예방적 규율을 채택하였다. 한편 일본은 저작권법 제30조의4를 통해 정보해석 목적의 이용을 폭넓게 허용함으로써, 학습 단계에서의 법적 불확실성을 대폭 완화하였으며 영국은 아예 인공지능 산출물도 인간의 저작물과 구별하지 않고 있어 기존 법체계 내에서의 권리남용을 제재하는 방식을 택하고 있다. 그러므로 생성형 인공지능 소프트웨어 개발자의 주의의무가 사후적·사실판단 중심의 불확실성이 여전히 크다는 현행 불안을 해소하기 위해서는 첫째, 합법적 접근이 가능한 데이터만을 학습에 사용할 것, 둘째, 권리관리정보(RMI) 제거·변경을 최소화하고 투명성을 확보할 것, 셋째, 출력 단계에서 실질적 유사성 및 시장 대체 가능성을 통제할 것이라는 세 축으로 정리되는 보편적 법리를 입법화하는 시도를 검토해 볼 필요가 있다. 이는 인공지능 기술 발전을 위축시키지 않으면서도 저작권자의 정당한 이익을 보호하기 위한 균형점에 해당한다. 향후 우리 법제 역시 인공지능 학습을 둘러싼 불확실성을 해소하기 위해, 공정이용 해석에만 의존하기보다 TDM에 관한 명시적 규율, 투명성 기준, 그리고 출력 통제 중심의 책임 구조를 단계적으로 정립할 필요가 있다. 이러한 제도적 정비는 생성형 AI 기술을 ‘위험한 회색지대’가 아닌, 예측 가능하고 신뢰 가능한 혁신 영역으로 전환시키는 토대가 될 것이다.
Abstract
This study examines the duty of care for AI software developers, focusing on copyright infringement issues raised by the proliferation of generative AI. Specifically, this study attempts to interpret the specific provisions of copyright law that may be infringed by AI software developers amid the proliferation of generative AI technology, distinguishing between the learning stage and the output and distribution stages.Currently, there is considerable confusion among Korean developers regarding the duty of care they must bear when developing generative AI software. This study examines the potential for copyright infringement at each stage of generative AI software technology and examines the potential legal issues that may arise. Next, this study explores the relationship between generative AI technology and copyright. To assist Korean developers in pursuing a sophisticated legal approach, this study explains the differences between traditional copyright law and the copyright requirements for generative AI technology. Therefore, to address the current anxiety surrounding the still significant uncertainty surrounding the ex post facto, fact-based, and ex post facto duty of care for generative AI software developers, it is necessary to consider enacting a universal legal principle that can be summarized as follows: 1) only use legally accessible data for training; 2) minimize the removal or modification of Rights Management Information (RMI) and ensure transparency; and 3) control substantial similarity and market substitutability at the output stage. This represents a balance that protects the legitimate interests of copyright holders without hindering the development of AI technology. Going forward, our legal system should also gradually establish explicit regulations on TDM, transparency standards, and an accountability structure centered on output control, rather than relying solely on fair use interpretations to address the uncertainty surrounding AI learning. Such institutional reforms will lay the foundation for transforming generative AI technology from a “dangerous gray area” to a predictable and reliable area of innovation.
- 발행기관:
- 비교법학연구소
- 분류:
- 기타법학