다언어 LLM의 개인정보 보호 응답 불균형과 지역 기반 제어 정책 모델 제안
Privacy Protection Disparities in Multilingual LLMs and Policy Alignment Strategies Based on Regional Jurisdictions
한종문(고려대학교); 권헌영(고려대학교)
35권 4호, 827~837쪽
초록
본 연구는 다언어 LLM(Large Language Model)이 동일한 정보를 담은 질문이라 하더라도 입력된 언어에 따라 이를 개인정보로 인식하거나 그렇지 않게 처리하는 문제를 중심으로 다룬다. 예를 들어, 특정인과 연계된 정보(예: 회사, 동아리 등)에 대해 한국어로 질문할 경우 개인정보 보호를 이유로 응답이 차단되지만, 다른 언어(예: 영어, 아랍어 등)로 유사한 질문을 하면 정보가 그대로 노출되는 현상이 존재한다. 이는 LLM이 언어별로 데이터를 학습하고 응답 정책을 다르게 적용하기 때문에 발생하며, 결과적으로 개인정보 보호 수준의 불균형, 규제 회피 가능성, 사용자 신뢰 저하 등의 문제를 야기한다. 본 논문은 이러한 문제의 실태를 다양한 언어로 구성된 질문 실험을 통해 검증하고, 그 결과를 기술적·정책적 관점에서 분석하였다. 이를 바탕으로, LLM의 응답 제어 기준이 ‘언어’가 아닌 ‘지역(법적 관할권)’을 기반으로 정렬되어야 함을 주장하며, 넷플릭스나 유튜브 등 글로벌 콘텐츠 서비스에서 사용되는 지역 기반 필터링 구조를 참고하여 LLM에도 적용 가능한 응답 제어 모델을 제안한다. 본 연구는 다언어 LLM의 개인정보 보호 체계에 대한 기술적·정책적 개선 방향을 제시하고, 글로벌 AI 서비스의 규제 정합성과 책임성을 확보하는 데 기여하고자 한다.
Abstract
This study examines how multilingual LLMs handle identical queries differently based on input language, particularly in recognizing personal information. For example, a query in Korean may be blocked for privacy reasons, while the same query in English or Arabic may be answered. This inconsistency, driven by language-specific policies, raises concerns about uneven privacy protection and regulatory gaps. The paper conducts multilingual experiments to analyze this issue and proposes that LLM response controls be aligned with legal jurisdictions rather than language. A region-based governance model, inspired by content platforms like Netflix, is suggested to enhance regulatory consistency and accountability in global AI services.
- 발행기관:
- 한국정보보호학회
- 분류:
- 컴퓨터학