인공지능 시대의 비정형 데이터 수집과 개인정보 보호
Unstructured data collection and personal information protection in the artificial intelligence era
김현정(김앤현 법률사무소)
56호, 323~348쪽
초록
인공지능 시스템은 데이터로부터 학습한 통계적 특성을 바탕으로 특정 상황에서인간과 같이 의사결정을 독립적으로 할 수 있는 기계 시스템을 말하는 것으로, 필연적으로 데이터를 학습하는 과정이 선행되어야 한다. 인공지능 학습을 위하여 수집된여러 데이터 중 최근 이미지, 영상, 텍스트 등 비정형 데이터의 비중이 높아지고 있는데 이러한 비정형 데이터 수집에 있어 개인정보 보호의 필요성이 강하게 대두되고 있다. 특히 생성형 인공지능 시스템의 학습에는 다양한 문제해결 방법을 반복적으로 시험하면서 시행착오를 스스로 최적의 방법을 찾는 훈련이 필요한데, 그 결과 기존의인공 지능 시스템에 비해 훨씬 더 많은 데이터가 필요하다. 이 과정에서 인터넷에 연결된 컴퓨터들이 공개된 모든 이미지, 영상, 텍스트 등 비정형 데이터들을 무작위로수집하여 훈련에 활용하는 현상이 문제가 되었다. 과거 개인정보 보호법은 인공지능등 빅데이터 수집 그 자체에 의한 정보 주체의 법익 침해를 설정하지 않고 정보주체의대칭점에 있는 개인정보처리자에게 형사책임과 민사 손해배상 책임, 행정적인 책임을지우는 것을 주요 내용으로 하였다. 따라서 인공지능 시스템 하 비정형 데이터의 수집량이 비약적으로 증가함에 따라 개인정보를 포함하고 있는 비정형 데이터들을 개2023 변호사(제56집) 324 인정보 보호법으로 포섭하여 규제하기 위해서는 관련 법규의 공백을 해결하는 것이우선적인 과제였다. 이에 따라 2023년 3월 개인정보 보호법이 전면 개정되어 2023년9월부터 점진적으로 시행되고 있다. 개정 개인정보 보호법상 비정형 데이터 수집과관련한 내용은 1) 자동화된 결정에 대한 정보주체의 권리 규정 및 개인정보 전송요구권 등 정보 주체에 능동적인 권리를 부여하고 2) 비정형 데이터 수집 기기의 정의 및규제 기준을 마련한 것이다. 인공지능 시스템 발전에 따라 개인정보 보호 상 중요해지는 것은 인공지능 서비스 제공자들은 제품 · 서비스 개발 시 기획 단계부터 이용자의 프라이버시를 고려한 기술 · 정책을 설계에 반영하는 것이다. 따라서 개인정보 보호법이 문제 발생 후 사후 처리에 머무를 것이 아니라, 능동적으로 인공지능 학습을위한 비정형 데이터의 가명처리 기준 마련, 비정형 데이터를 포함한 개인정보 국외이전에 따른 빅테크 기업에 대한 제재 기준 마련, 합법적인 비정형 데이터 수집을 위한인공지능 서비스 제공업자들과의 협력을 도모하는 등 발전적인 방향으로 나아가는것이 필요하다.
Abstract
Artificial intelligence systems refer to mechanical systems that can make decisions independently like humans in certain situations based on statistical characteristics learned from data, and the process of learning data inevitably must precede. Among the various data collected for artificial intelligence learning, the proportion of unstructured data such as images, videos, and texts is increasing recently, and the need for personal information protection in collecting such unstructured data is strongly emerging. In particular, learning of generative artificial intelligence systems requires training to find the optimal way to do trial and error on its own while repeatedly testing various problem-solving methods, and as a result, much more data is needed compared to existing artificial intelligence systems. In this process, it became a problem that computers connected to the Internet randomly collect unstructured data such as all published images, videos, and texts and use them for training. The existing Personal Information Protection Act does not establish the infringement of the legal interests of the information subject by the collection of big data such as artificial intelligence itself, but imposes criminal responsibility, civil damage liability, and administrative responsibility to the personal information controller at the symmetry of the information subject. Therefore, as the amount of unstructured data collected under the artificial intelligence system increased dramatically, the priority was to resolve the gap in related laws and regulations to include unstructured data containing personal information into the Personal Information Protection Act. Accordingly, the Personal Information Protection Act was completely revised in March 2023 and has been gradually 2023 변호사(제56집) 348 implemented since September 2023. Under the revised Personal Information Protection Act, information on collecting unstructured data is 1) granting active rights to information subjects, such as the right of the data subject to automated decisions and the right to request personal information transmission, and 2) defining and regulating standards for unstructured data collection devices. What becomes important in terms of personal information protection with the development of artificial intelligence systems is that artificial intelligence service providers reflect technologies and policies that take into account user privacy from the planning stage when developing products and services. Therefore, it is necessary for the Personal Information Protection Act to move forward in a developmental direction, such as actively preparing pseudonymization standards for unstructured data for artificial intelligence learning, preparing sanctions for big tech companies for the transfer of personal information abroad, and promoting cooperation with artificial intelligence service providers for legitimate unstructured data collection.
- 발행기관:
- 서울지방변호사회
- 분류:
- 법학