범죄학 연구와 결측 : 실제 자료를 활용한 결측 대치법 비교 분석
Data in Criminology and Missingness: Comparison of Missing Imputations utilizing Real-World Data
라광현(Univ. of South Carolina at Columbia)
29권 1호, 281~308쪽
초록
실증 연구를 위한 조사 자료에서 결측값이 존재하는 것은 연구자가 흔히 맞이할 수 있는상황이다. 사회과학 연구에서 자주 활용되는 자기보고의 경우, 응답자는 실수로 어떠한 문항을답하지 않을 수도 있으며, 고의적으로 응답하기 불편한 문항을 제외하고 설문을 마무리 할 수있다. 이러한 결측은 통계분석 결과에서 1종 오류 및 2종 오류가 나타나는 것과 관련이 있다. 이 연구는 범죄학 연구에서 결측 처리의 중요성 및 주요 결측 처리 방법을 논의하였으며, 결측대치를 통한 해법을 중심으로 한국아동・청소년패널조사 중1패널 6년차 자료를 활용한 분석 결과를 비교하였다. 분석 결과, 연쇄방정식을 활용한 다중대치 및 확률적 회귀대치 자료들은 결측값이 존재하는원조사 자료에 비하여 완전한 자료에 가까운 결과를 나타냈으며, 원조사 자료의 경우, 회귀분석결과에서 1종 및 2종 오류의 징후가 모두 나타났다. 이상의 결과를 종합하여 볼 때, 범죄학연구에서 결측값의 처리는 매우 중요하다고 할 수 있다. 범죄학 연구에서 발생하는 결측은 범죄학 연구의 주요 관심인 범죄 및 일탈과 관련되었을 가능성이 크며, 결측을 적절히 처리하지않을 경우 범죄학 연구의 중요한 대상(예를 들어, 범죄 및 일탈 성향이 높은 응답자)을 제외시키며 통계분석 결과를 왜곡시킬 우려가 있다. 한편 실무적으로, 조사자료 및 공식통계 등 통계자료를 활용한 실증연구는 증거에 기반을 둔 과학적인 정책 수립을 위한 매우 중요한 자료로 활용될수 있다는 점에서 범죄 관련 통계 자료를 분석할 때, 결측을 적절하게 처리하는 것은 학술적가치뿐만 아니라 정책적인 의미를 가진다.
Abstract
Researchers often find that their datasets have missing values. In self-report surveys that are frequently utilized in social science research, respondents are able not to answer certain questions, or accidentally, they may not answer an item. These missing values are relevant to occurrence of type 1 error and type 2 error. The current study reviewed the significance of proper treatment of missing values and discussed several methods to handle missingness in data. In addition, this study compared results from several imputation methods, utilizing data from the Korean Children & Youth Panel Survey. It is found that results from multiple imputation and regression-based imputation are similar to those from the proxy data of real world, whereas the row data that include missing values have some symptoms of type 1 and type 2 errors. Given the results, it is imperative to properly handle missing values in criminology research. In survey datasets, missing values may be related to crime and delinquency so that non-treatment of missing values may result in significant subjects in the dataset (e.g., individuals with high criminality), biasing the estimations of statistical analyses. The results also have some practical implications in that empirical findings are often utilized as scientific evidence of policies and practices.
- 발행기관:
- 한국형사법무정책연구원
- 분류:
- 법학