자기조직화지도 신경망을 활용한 의료 진단검사 결과 패턴인식 모델
Pattern Recognition Model of Medical Diagnostic Test Results using Self-Organising Map Neural Network
박상찬(경희대학교); 이장희(한국기술교육대학교)
29권 1호, 115~134쪽
초록
의학 및 생물학계에서 질병의 조기 선별이나 진단을 위해 인체에서 발생하는 각종 검체에 대해 다양한 진단검사가 시행되고 있고, 진단검사 결과 데이터는 질환을 표지하는 정보를 가지고 있기에 정확한 분석과 해석이 수행되어야 한다. 의료기관에서 수행하는 다양한 유형의 의료 진단검사로부터 발생하는 대용량 데이터를 최적의 분석 방법을 활용하여 정보 및 지식화 함으로써 이를 기준으로 양질의 의료서비스를 제공할 수 있는 기반을 구축할 필요가 있고 최근 이러한 노력이 수행되고 있다. 본 연구는 의료 진단검사 결과 데이터에 존재하는 검사결과 패턴들을 추출하고 분류하여, 의료진의 신속․정확한 의사결정과 종합적인 통찰력 향상을 지원할 수 있는 의료 진단검사 결과 패턴인식 모델을 제안한다. 제안 모델의 1단계에서는 자기조직화지도 신경망을 활용하여 의료 검사 데이터에 존재하는 유의한 진단검사 결과 패턴들을 추출한다. 최적의 진단검사 결과 패턴만을 추출하기 위해, 본 연구에서 제안한 모델에서는 Davies-Bouldin 지수를 산출하여 최적의 패턴 수를 결정하고 이를 반영하여 자기조직화지도 신경망을 사용하여 패턴을 추출한다. 제안 모델의 2단계에서는 신규 수진자의 진단검사 결과 데이터가 발생하면 1단계에서 추출했던 최적의 진단검사 결과 패턴들과의 내적 값을 산출하여 유사도 수준을 규명하여 신규 수진자의 진단검사 결과 패턴으로 분류한다. 본 연구에서 제안한 패턴인식 모델을 국내에서 다양한 의료 진단검사를 수행하는 의료기관에서 수행한 89종의 혈액 진단검사 데이터 집합에 적용함으로써 실무 적용의 타당성을 검증하였다. 제안 모델의 적용을 통해, 우선적으로 수진자의 성별과 연령대별로 존재하는 89종 혈액 검사결과 패턴들을 추출하였다. 이를 통해, 성별과 연령대별로 유의하게 존재하는 89종 혈액 검사의 중요한 특징과 경향 및 수진자 개별로 존재하는 특징 및 경향이 무엇인지 쉽게 확인할 수 있었다. 또한, 추출한 진단검사 결과 패턴들을 기준으로 신규 수진자의 혈액 검사 데이터를 패턴 매칭 함으로써, 신규 수진자의 진단검사 결과 패턴을 분류하였다. 이와 같은 결과로부터, 본 연구에서 제안한 진단검사 결과 패턴인식 모델이 의료기관에서 발생하는 대용량 데이터의 분석 및 가공을 통해 의료기관의 의료 정보 및 지식 관리 실무에 효과적으로 활용될 수 있음을 확인할 수 있었다. 본 연구는 Davies-Bouldin 지수와 자기조직화지도 신경망의 논리적인 연계 활용과 자기조직화 신경망 기반의 지식 추출 및 지식 활용 과정을 구체적으로 제시하는 패턴인식 모델을 검증하였다는 점에서 학술적 의의가 있다.
Abstract
In the academic area of medicine and biology, various diagnostic tests on all sorts of samples occurred from human body have been conducted for the purpose of early screening and diagnosis for diseases. Medical institutions need to establish the foundation to offer a good quality of medical service, which can informationize large amounts of data generated from various types of medical diagnostic test performed. This study proposes a new pattern recognition model (refer to the following figure). The model is composed of two phases. In the first phase, the proposed model uses Self-Organizing Map neural network to extract all existing test results patterns within the previous medical test results data. It calculates Davies-Bouldin index to determine the optimal number of extracted patterns before using Self-Organizing Map neural network. The extracted test results patterns are stored in the knowledge repository with the form of Self-Organizing Map weight vector. In the second phase, the proposed model uses all extracted patterns to classify the pattern of the test data of a new examinee by measuring similarity levels between the his/her test data and the extracted patterns. It calls similarity level between them “similarity score”, which is obtained by calculating their inner products. The similarity score (SS) has the value between 0 and 1. The model classifies a new examinee’s test result data by comparing its similarity score with similarity criteria. In case the similarity score is higher than similarity criteria, the model assigns a special pattern to that examinee. We applied the proposed model to the 89 kinds of blood diagnostic tests data in domestic medical institution. The domestic medical institution provided the 89 kinds of blood diagnostic tests such as liver function test, Hepatitis viruses test, renal function test, electrolyte and metabolism test, lipid and cardiovascular system test, blood-sugar test, gout and rheumatic diseases test, hematodyscrasia test, urine test, anemia test, thyroid test, carcino-marker test, etc. This study has implications at aspects of both practice and research. For practice, the proposed model can help medical team to find accurate status information on several test results quickly, which could contribute to make next optimal progress. For research, this study contributes to hybrid application knowledge of Self-Organizing Map neural network and Davies-Bouldin index. This study has some limitations. We only considered Self-Organizing Map neural network in our research. In future work, more other clustering method, such as expectation-maximization clustering algorithm, should be taken into consideration. We will also apply the model to other kinds of medical data to get more validation.
- 발행기관:
- 대한경영학회
- 분류:
- 경영학