애스크로AIPublic Preview
← 학술논문 검색
학술논문Telecommunications Review2014.06 발행

공공데이터의 연구목적 제공에 있어 개인정보보호의 문제: 익명화를 중심으로

Data Privacy when Disclosing Public-sector Data for Research Purposes in Korea : Focusing on Anonymization Issues

고학수(서울대학교); 정해빈(서울대학교)

24권 3호, 315~326쪽

초록

공공기관이 보유하고 있는 데이터를 연구목적 등을 위해서 공개하는 것은 일반적으로 데이터에 포함된 정보를 유용하게 활용할 수 있는 기회를 제공하는 한편, 데이터의 활용 과정에서 어떻게 개인정보에 대한 적절한 보호수준을 유지할 것인지에 관한 쉽지 않은 문제를 제기한다. 이 글에서는 공공데이터의 연구목적 제공에 있어 발생할 수 있는 개인정보보호 맥락에서의 법제도적 쟁점들을 분석하여 정책적 시사점을 얻고자 하였다. 데이터의 공개와 관련된 익명화 및 재식별 등의 가능성에 대한 검토를 거쳐 도출된 시사점은 다음과 같다. 첫째, 정보주체로부터 직접적인 동의를 받기 쉽지 않은 현실적인 여건 및 그와 관련된 국내법의 체계를 고려하면, 연구목적 데이터의 공개를 위해서는 데이터에 대한 익명화는 많은 경우에 필수적이다. 둘째, 익명화에 관해 법에 규정되어 있기는 하지만, 그 구체적인 수준이나 방법 등에 관해서는 명확한 규정이나 일반적인 규범이 아직 형성되지 않은 상황이어서 그에 대해 상세한 검토와 지속적인 관심이 필요하다. 셋째, 건강보험 코호트DB의 경우, 주소를 광역시·도 수준에서 제한적으로 공개하는 방식을 택하였는데 이로 인해 익명화의 수준은 매우 높게 유지할 수 있었던 한편, 그 과정에서 데이터에 포함된 정보의 유용성이 떨어지게 되었을 가능성이 있다. 넷째, 익명화 데이터에 대하여 제3의 비정형 데이터를 구하여 개인정보의 재식별을 위한 시도를 해볼 수 있으나, 이러한 시도는 ‘의욕적인 침입자’를 상정한 상황에서는 성공하기 어려운 경우가 많고, 의료정보 등 전문적이고 복잡한 내용의 데이터에 대해서는 재식별은 더욱 어려운 것으로 보인다.

Abstract

Disclosing data held by government and public institutions would in general provide a valuable opportunity to usefully utilize the information contained in the disclosed data. At the same time, however, disclosing a large-scale data would raise significant privacy and data protection issues. In this article, we analyze issues on privacy and data protection that may arise in the context of providing public data for research purposes. Conclusions, in particular regarding issues related to anonymization and re-identification, are as follows. First, considering relevant legal regulations and the practical difficulty of obtaining explicit consents from data subjects, anonymization is crucial and inevitable. Second, although there are legal provisions on anonymization, no details or specifics have been stipulated. As such, continued interest and further examination is required to develop a consensus view or standard. Third, in the case of the cohort DB of the Korean national health insurance service which was made available temporarily for pilot research purposes, among other things, address information which was provided at a provincial level is very broad. This made the level of anonymization very high and re-identification all but impossible. At the same time, this may have reduced the usefulness of the disclosed data. Fourth, in the case of health information, which is fairly complex and requires a certain degree of expertize to understand, even if re-identification takes place, such re-identification would be a small scale one-off event. Large scale systematic re-identification would almost impossible if one assumes a “motivated intruder.”

발행기관:
에스케이텔레콤 (주)
분류:
전자/정보통신공학

AI 법률 상담

이 논문의 주제에 대해 더 알고 싶으신가요?

460만+ 법률 자료에서 관련 판례·법령·해석례를 찾아 답변합니다

AI 상담 시작
공공데이터의 연구목적 제공에 있어 개인정보보호의 문제: 익명화를 중심으로 | Telecommunications Review 2014 | AskLaw | 애스크로 AI