애스크로AIPublic Preview
← 학술논문 검색
학술논문마케팅논집(Journal of Marketing Studies)2024.09 발행

지역밀착 거래 플랫폼의 제품판매정보 텍스트 분류를 활용한 개인정보 예측에 관한 연구

Model for Predicting Personal Information Exposure Using Text Classification of Product Sales Information on a Hyper-Local Transaction Platform

서상윤(경남대학교 경영학부)

32권 3호, 61~75쪽

초록

본 연구는 지역밀착 제품 거래서비스 이용자들의 개인정보 노출 위험을 진단하는 모형을 개발하는 것을 목표로 수행되었다. 연구는 개인정보 노출 위험을 예측하기 위해 판매 게시글 데이터 세트를 확보하고, 성별 정보와 혼인여부를 텍스트 분석을 통해 예측 및 분류하는 것을 중심으로 진행되었다. 이를 위해 판매글 데이터 세트를 확보하고, 성별 및 혼인여부에 대한 라벨링 작업을 수행하였다. 그리고 LDA 토픽 분석을 통해 판매글의 유형을 분류하고 그 특성을 개발하였다. 데이터는 지역밀착 거래서비스 플랫폼에 게시된 글을 스크랩핑하여 수집되었으며, LDA 토픽 분석 결과, 제품 유형에 따라 판매자의 성별 및 혼인여부를 추정할 수 있는 단어들이 자주 등장하는 것을 발견하였다. 이를 바탕으로 나이브베이즈 모형을 개발하여 판매자의 성별 및 혼인여부 노출 위험을 예측한 결과, 성별 예측 정확도는 74.6%, 혼인여부 예측 정확도는 95%로 나타났다. 연구 결과는 개인정보 노출 위험이 높은 제품 유형과 단어들을 식별하여 사용자들의 안전한 거래를 돕는 데 기여할 것으로 보인다.

Abstract

This study aims to develop a model for diagnosing the risk of personal information exposure among users of hyper-local product transaction services. The research focuses on predicting and classifying gender information and marital status through text analysis by securing a dataset of sales posts. To achieve this, the sales post dataset was collected, and labeling for gender and marital status was performed. Latent Dirichlet Allocation (LDA) topic analysis was then used to classify the types of sales posts and identify their characteristics. Finally, a Naive Bayes model was developed to diagnose the risk of gender and marital information exposure. The data was scraped from posts on a hyper-local transaction service platform and analyzed using various packages in the R programming language for web scraping, topic analysis, and Naive Bayes analysis. The LDA topic analysis revealed that certain words frequently appeared in sales posts based on product type, allowing for the estimation of the seller's gender and marital status. Using this information, a Naive Bayes model was developed to predict the risk of exposure of the seller's gender and marital status, with a gender prediction accuracy of 74.6% and a marital status prediction accuracy of 95%. The results of this study are expected to contribute to safer transactions by identifying product types and words with high personal information exposure risk.

발행기관:
한국전략마케팅학회
DOI:
http://dx.doi.org/10.22736/jms.32.3.04
분류:
국내마케팅

AI 법률 상담

이 논문의 주제에 대해 더 알고 싶으신가요?

460만+ 법률 자료에서 관련 판례·법령·해석례를 찾아 답변합니다

AI 상담 시작
지역밀착 거래 플랫폼의 제품판매정보 텍스트 분류를 활용한 개인정보 예측에 관한 연구 | 마케팅논집(Journal of Marketing Studies) 2024 | AskLaw | 애스크로 AI