애스크로AIPublic Preview
← 학술논문 검색
학술논문법학논총2026.01 발행

전자책 TTS 음성 생성ㆍ전송과 배타적발행권 침해에 관한 소고 – 서울고등법원 2025. 6. 19. 선고 2024나 2011618 판결을 중심으로 -

A Study on E-book TTS Audio Generation and Transmission and the Infringement of Exclusive Publication Rights - Focusing on the Seoul High Court Decision of June 19, 2025 (2024Na2011618) -

정윤경(고려대학교 법학연구원)

64권, 247~289쪽

초록

전자책과 디지털 기반 독서 플랫폼의 확산에 따라 TTS(Text-to-Speech) 기술을 활용한 음성 기반 독서 기능이 플랫폼 경쟁력을 좌우하는 핵심 요소로 부상하고 있다. TTS는 시각장애인ㆍ고령자 등 정보취약계층의 독서 접근성을 실질적으로 확대하는 기술인 동시에, 오디오북 시장의 급속한 성장과 결합하여 새로운 콘텐츠 유통 방식으로 기능하고 있다. 그러나 텍스트를 음성으로 변환하여 제공하는 행위가 저작권법상 어떠한 법적 성격을 갖는지, 그리고 이에 따라 어떠한 권리 침해 문제가 발생할 수 있는지에 관하여 명확한 기준이 확립되지 않아 법적 논란이 제기되고 있다. 이러한 문제의식이 현실화 된 사례가 바로 KT 밀리의 서재와 윌라 간의 오디오북 및 TTS 제공을 둘러싼 분쟁이다. 이 사건은 전자책 구독 플랫폼인 KT 밀리의 서재가 전자책 텍스트를 TTS 기술을 통해 음성으로 변환ㆍ제공한 행위가, 오디오북 제작ㆍ유통에 관한 배타적 발행권을 보유한 윌라의 권리를 침해하는지 여부를 핵심 쟁점으로 한다. 이에 대하여 서울고등법원은 1심과 달리, 플랫폼이 제공하는 TTS 서비스가 단순한 보조적 기능에 그치지 않고 저작물의 이용 방식을 실질적으로 변화시키는 점을 중시하여 해당 서비스가 오디오콘텐츠에 관한 배타적 발행권을 침해한다고 판단하였다. 법원은 특히 TTS 과정에서 이루어지는 음성 변환이 단순한 접근성 기능 제공에 그치는 것이 아니라, 텍스트를 음성이라는 독립된 매체를 통해 재현ㆍ전달하는 실질적인 저작물 이용행위에 해당한다고 보았다. 나아가 음성 파일(wav)의 생성ㆍ삭제ㆍ전송에 이르는 전 과정을 플랫폼이 기획ㆍ설계ㆍ통제하고 있다는 점을 근거로, 복제 및 전송의 실질적 행위주체를 이용자가 아닌 플랫폼으로 판단하였다. 그 외에도 계약 문언과 체결 경위를 고려하여, 오디오콘텐츠의 정의에 TTS가 명시적으로 포함된 이상 배타적발행권의 보호 범위는 기술적 구현 방식과 무관하게 음성을 매개로 한 텍스트 이용 전반에 미친다고 해석하였다. 이와 관련하여 본고에서는 대상 판결을 중심으로, 전자책 텍스트를 음성으로 자동 변환하는 TTS 음성 생성 과정이 저작권법상 배타적발행권에 포함되는 복제 행위로 평가될 수 있는지 여부를 검토하고, 나아가 그 과정에서 이루어지는 복제 및 전송 행위의 실질적 주체를 누구로 보아야 하는지를 분석하였다. 아울러 접근성 기능 제공이라는 기술적ㆍ사회적 목적을 고려할 때, 해당 행위에 저작권 제한 규정이 적용될 여지가 있는지에 대해서도 살펴보았다. 또한 TTS를 포함한 음성 변환 기술 전반의 법적 성격을 보다 정교하게 정립할 필요성을 제기하고, 접근성 목적의 이용과 영리적 서비스 제공을 구분할 수 있는 규범적 기준을 모색하였다. 이를 토대로 권리자 보호, 기술 혁신, 이용자 접근권이라는 상충하는 가치 간의 조화를 도모할 수 있는 해석론적ㆍ입법론적 방향을 제시하고자 하였다.

Abstract

With the expansion of e-books and digital reading platforms, text-to-speech (TTS) technology has emerged as a key competitive feature in platform-based reading services. TTS functions not only as an accessibility tool that substantially enhances reading access for information-vulnerable groups such as persons with visual impairments and older adults, but also as a new mode of content distribution closely intertwined with the rapid growth of the audiobook market. Nevertheless, significant legal uncertainty remains regarding the copyright characterization of converting textual works into audio through TTS and the scope of rights that may be implicated by such practices. These issues came to the forefront in the dispute between KT Millie’s Library and Willa concerning the provision of audiobook and TTS services. The core legal question was whether KT Millie’s Library’s practice of converting e-book text into audio via TTS infringed Willa’s exclusive publication rights relating to audiobook production and distribution. Departing from the lower court’s ruling, the Seoul High Court held that the platform’s TTS service went beyond a merely auxiliary accessibility function and instead constituted a substantive transformation of the mode of exploiting copyrighted works, thereby infringing exclusive publication rights in audio content. The Court emphasized that the audio conversion involved in the TTS process was not limited to facilitating access, but rather amounted to the reproduction and communication of the work through an independent audio medium. Furthermore, noting that the platform planned, designed, and controlled the entire process of generating, deleting, and transmitting audio files (WAV), the Court identified the platform—not the user—as the substantive actor responsible for reproduction and transmission. The Court also interpreted the relevant contractual provisions to mean that, where TTS was explicitly included within the definition of “audio content,” the scope of exclusive publication rights extended to all text-to-audio uses regardless of the specific technical implementation. Against this backdrop, this article analyzes whether the automated generation of audio from e-book text via TTS constitutes a form of reproduction encompassed by exclusive publication rights under copyright law, and how the substantive actor responsible for reproduction and transmission should be identified in platform-based services. It further examines whether copyright limitations may apply in light of the technological and social objectives of accessibility. Finally, the article argues for a more refined legal characterization of TTS and other audio conversion technologies and explores normative criteria for distinguishing accessibility-oriented uses from commercial services, with the aim of proposing interpretive and legislative directions that balance copyright protection, technological innovation, and users’ rights of access.

발행기관:
법학연구소
DOI:
http://dx.doi.org/10.35867/ssulri.2026.64..007
분류:
법해석학

AI 법률 상담

이 논문의 주제에 대해 더 알고 싶으신가요?

460만+ 법률 자료에서 관련 판례·법령·해석례를 찾아 답변합니다

AI 상담 시작
전자책 TTS 음성 생성ㆍ전송과 배타적발행권 침해에 관한 소고 – 서울고등법원 2025. 6. 19. 선고 2024나 2011618 판결을 중심으로 - | 법학논총 2026 | AskLaw | 애스크로 AI