인공지능의 법적 규율 Ⅰ: 범용모델과 생성모델
Legal Oversight of AI, Part One: General-Purpose/Generative Model
박상철(서울대학교 법학전문대학원)
65권 1호, 65~124쪽
초록
트랜스포머(Transformer) 기반 디코더(decoder)들이 범용모델(general-purpose model)[기반모델(foundation model)로도 칭함]이면서 별도의 미세조정(fine-tuning) 등 없이 바로 생성적 작업(task)을 위해 활용될 수 있다는 점으로 인해, 범용모델과 생성모델(generative model)의 개념은 흔히 혼용된다. 그러나 양자는 위해의 유형이 다르니 분별하여 이하의 법적 대응을 강구해야 한다. 첫째, 최근의 고성능 범용모델 안보⋅안전성 통제론은 새로운 국제통제체제로 이어질 수 있으나 섣부른 국내 규제법 창설의 근거로 전용하기보다는 경제안보의 관점(국제공급망에 대한 접근, 상호운용성 유지, 산업 보호)에서 신중히 접근해야 한다. 둘째, 범용모델이든 특정 작업을 위한 모델이든 개발자 등의 훈련 과정에서 저작권자⋅정보주체 등 이해관계자들의 권리 조정이 요구된다. 데이터 접근과 모델 연구⋅개발은 편익과 “지식의 수집”으로서의 특성을 고려하여 과도하고 중복적인 데이터셋 보호 법제를 정비하면서 허용 범위를 넓혀야 한다. 다만 모델의 제공자는 저작물이나 (데이터 접근은 적법하나 이용 동의가 없는) 개인정보를 처리하여 모델을 훈련함에 있어 판별⋅생성 등 의도된 작업 수행 과정에서의 침해 리스크를 예견하여 가용한 경감조치를 취하도록 요구받아야 한다. 특히 생성 작업의 경우, (1) (시퀀스의) 검색(retrieval) 방식은 전통적 유형의 복제와 유사한 침해 리스크가 있으므로 개인정보는 익명처리, 저작권은 집단적 보상체계[집단권리관리(CRM), 사적복제부담금(PCV) 등]로 해결하되, (2) (토큰 등의) 생성(generation) 방식은 암기(memorization) 문제의 특성을 고려하여 일률적 가명처리나 이용허락을 요하기보다는 경감조치의 합리적 요구수준을 정하여 달성 시 안전지대(safe harbor)를 허여하는 것이 합리적이다. 셋째, 딥페이크 등 합성매체의 오용 문제는 범용모델 개발상의 문제가 아닌 생성모델 실행상의 문제로서 오용자에 대한 기존의 금지⋅제재 체계의 집행을 강화하되 제공자⋅배포자의 오용 경감 협력조치의 범위를 명확히 하여 가치망 전체 차원의 효율적 대응을 강구해야 한다. 넷째, 생성모델의 조력을 받은 발명과 창작에 대한 권리는 약화시키면서 균형을 상실한 지식재산권의 재조정의 계기로 삼아야 한다. 다섯째, 범용/생성모델의 정확성⋅공정성⋅투명성 문제는 판별모델(discriminative model)에 비해 즉각적인 규제의 필요는 적으며, 측정 및 경감기술의 개발 촉진 및 표준화로 대응해야 한다.
Abstract
Transformer-based decoders offer generative capabilities without requiring fine-tuning, blurring the distinction between general-purpose and generative models. Given their disparate risk profiles, however, tailored legal oversight should be devised for each category. First, safety and security control over high-impact general-purpose models must be crafted to ensure alignment with international standards and national security objectives. Second, to broaden the scope of lawful data access, nebulous dataset protection legislation should be refined, with developers and providers tasked with mitigation measures based on infringement risk assessment. Particularly, developers of models intended for use in generative tasks should be mandated, (i) for retrieval-based models: to anonymize publicly unavailable personal data and compensate rightsholders through collective rights management (CRM) or private copying levies (PCV); and (ii) for generation-based models: to adopt reasonable mitigation measures to qualify for a safe harbor. Third, the misuse of synthetic media should be addressed by not only reinforced enforcement against misusers but also clear allocation of responsibilities across the value chain. Fourth, machine-assisted creation should be granted weaker legal protections. Finally, accuracy, fairness, and transparency concerns in general-purpose/generative models should be addressed by developing and standardizing measurement and mitigation technologies instead of immediate legal interventions.
- 발행기관:
- 법학연구소
- 분류:
- 법학