M2M 빅데이터의 품질관리 영역 및 품질 요인에 대한 연구
A study of data quality dimensions and factors in machine to machine(M2M) big data
양동식(공주대학교); 노재민(공주대학교); 맹승렬(공주대학교); 박동진(공주대학교)
12권 3호, 233~247쪽
초록
의사결정의 성과란 면에서 데이터 품질에 대한 논의는 문제해결 분야에서 오래전부터 진행되고 오고 있다. 데이터 품질 향상을 위한 관리 활동에 있어서 가장 중요한 기준이 되는 것은 데이터의 품질관리 영역과 요인들을 파악하는 것이다. 최근에 빅데이터의 분석 및 처리와 관련하여 빅데이터 품질에 대한 연구가 시작되었다. 기존의 연구들은 빅데이터를 일정기간 저장 후 패턴/유형 분석을 위한 데이터의 품질에 초점을 맞추었다. 그러나 기계와 기계(M2M) 간에 발생되어 실시간으로 정보를 제공해야 하는 환경에서의 데이터 품질관리에 대한 연구는 아직 전무하다. 본 연구는 M2M 기반의 실시간 활용을 시스템의 빅데이터 품질관리를 위한 것이다. 즉, M2M 빅데이터의 품질관리 영역과 상세 품질요인들을 파악하고 AHP를 통한 상대적 중요도를 측정한다. 본 연구에는 전통적인 데이터 품질영역 및 빅데이터의 특성을 고려하여 데이터 뜻/의미의 정확성(semantic accuracy), 데이터 구조/형식의 정확성(syntactic accuracy), 데이터 시기적절성(timeliness), 그리고 데이터 보안성(security) 등을 품질영역으로 결정하였다. 또한 각 품질영역에서 주요 품질요인들을 파악하고 각각을 정의하였다. 본 연구에서는 M2M 실시간 데이터를 제공하는 시스템을 개발하는 프로젝트에 참여하고 있는 전문가들을 대상으로 설문과 인터뷰를 실시하여 품질영역 및 품질요인들의 상대적 중요도를 파악하였다. 이를 통하여 전문가들은 품질영역 중에서 데이터 뜻/의미(0.422) 영역에 이어서 시기적절성(0.344) 영역에 우선순위가 있음을 알 수 있었다. 본 연구는 학술적으로는 새로운 연구영역을 제시했다는데 의미가 있으며, 실무적으로 최근 진행되는 교통, 환경 및 도시시설과 관련된 M2M 실시간 정보제공을 위한 빅데이터 시스템 프로젝트에 적용될 수 있다는데 의미가 있다. 그러나 본 연구의 결과는 제한된 영역에서 실증한 결과이므로 일반화 하는 데에 한계가 있으며 추후 연구가 필요하다.
Abstract
Discussion about data quality in terms of decision-making performance has been ongoing in the field of problem solving for a long time. The most important criterion in data quality management is to identify the data quality dimensions and factors. Recently, research on the quality of big data has been started in relation to big data based decision making. Existing studies have focused on the quality of big data in pattern analysis, where data is stored for a certain period of time and analyzed. However, there is still no research on data quality management in an environment that needs to provide real-time information generated between machines (M2M). This study is for big data quality management of real-time utilization system based on M2M. That is, we identify the data quality dimensions, detailed quality factors, and their relative importance of M2M big data. In this study, we first considered the traditional data quality area and the characteristics of big data. So, in the final data quality dimensions, semantic accuracy, data structure/format accuracy, data timeliness, and data security were determined. In addition, major quality factors were identified in each quality dimension. In this study, the relative importance of quality dimensions and quality factors was identified by conducting questionnaires and interviews with experts participating in a project to develop a system that provides M2M realtime data. Through AHP analysis, we found that among the quality dimnesions, priority was given to the data meaning/meaning (0.422) dimension followed by the timeliness (0.344) dimension. This study is meaningful in that it has presented a new research area academically, and it is practically meaningful that it can be applied to the big data system project for providing M2M real-time information related to traffic, environment, and urban facilities. However, since the results of this study were verified in a limited area, there is a limit to generalization, and further research is needed.
- 발행기관:
- KNU 기업경영연구소
- 분류:
- 경영학일반