국가바이오포렌식포털시스템: 비인체 법생물을 위한 데이터베이스 및 기계학습 기반 분석시스템
National Bioforensic Portal System: The database and machine learning-based analysis systems for non-human forensic biology
안형은(상명대학교); 허보경(한국생명공학연구원); 최이수(시네틱스 기업부설연구소); Adeel Malik(상명대학교 지능정보기술연구소); 김정일(상명대학교 생명과학과); 최태준(상명대학교); 안재준(연세대학교); 하은호(연세대학교); 김창배(상명대학교)
8호, 1~45쪽
초록
DNA 염기순서결정 (DNA Sequencing)을 이용한 생물학적 증거의 DNA 분석은과학수사에 새로운 장을 열었고, DNA 분석 기법은 정확도, 속도, 민감도에서 최근까지 상당한 발전이 있었다. 이를 통해 얻어진 염기서열 빅데이터가 기하급수적으로 축적되었고, 다양한 인체 유전자 데이터베이스가 과학수사를 위해 운영되고 있다. 식물, 동물, 미생물 등 다양한 비인체 유래 법생물 DNA는 중요성이 입증되어 광범위한 범위에 적용되었으나, 장기간 다양한 연구를 통해 구축된 인체 유전학 데이터에 비해 데이터가 부족하다. 또한 이러한 비인체 법생물을 대상으로 한 연구를 통해 염기서열 데이터가 생산되고 있으나, 이를 분석하기 위한 분석 기법과 데이터베이스는 국내뿐만 아니라 국제적으로 미흡하므로 추가 연구와 개발이 필요하다. 본 연구에서 한국형 과학수사에 기여하기 위해 구축하고 개발한 비인체 법생물 정보를 제공하는 데이터베이스와기계학습을 도입한 비인체 법생물 염기서열 데이터 분석을 제공하는 시스템인 “국가바이오포렌식시스템 (www.bioforensic.kr)”을 소개하였다. 이 시스템은 과학수사를 위한 비인체 법생물 염기서열 분석을 위하여 생물종 및 서열검색, 생물종과 개체 식별분자마커 서열검색, 주요 해양생물 미토콘드리아 시토크롬 C 산화효소 소단위 I(COI, Cytochrome C oxidase subunit I)유전자 서열검색, 통계정보 제공 등의 기능을 포함한 데이터베이스와 인공지능 기반 법생물 염기서열 분석기, 비인체 생물종 포렌식DNA 분석 등 비인체 법생물 분석시스템을 제공한다. 본 시스템은 향후 지속적인 업데이트를 통해 새롭게 발굴된 데이터가 실제 과학수사 실무에 사용될 수 있도록 하며, 기계학습 기법의 발달에 따라 새로운 기법을 적용하여 수사기관에서 수행하는 법생물분석의 정확성과 효율성을 향상시킬 것이다. 또한 과학적이고 합리적인 수치화에 대한추가 연구를 통해 비인체 법생물 증거 분석 결과의 증명력 법정 증거능력의 획기적제고에 기여할 것이다.
Abstract
DNA analysis of biological evidence using DNA sequencing has broke new ground in forensic science, and DNA analysis techniques have significantly advanced in terms of accuracy, speed, and sensitivity until recent times. As a result, sequence big data obtained through this trend has accumulated exponentially, and various human genetic databases are being operated for forensics. Despite the proven significance and wide-ranging applications of non-human DNA from various sources such as plants, animals, and microorganisms, it remains evident that the data is still scarce compared to the extensive research and data accumulation in human genetics. In addition, researches on these non-human forensic organisms produce sequence data, but analysis techniques and databases to analyze these are lacking domestically and internationally, and further research and development are required. In this study, we introduce the "National Bioforensic System (www.bioforensic.kr)," a system designed to contribute to the forensic investigations in Korea, providing a database of sequences from non-human sources and implementing machine learning-based analysis of these sequences. To facilitate the sequence analyses of non-human organisms for forensics, the system provides a database including functions such as searching for species and sequences of these organisms, searching for species and individual identification molecular marker sequences, searching for major marine organism mitochondrial Cytochrome oxidase subunit I (COI) sequences, and providing statistical information, and a analysis system for non-human forensic sequences comprising machine learning-based analyzer and non-human forensic DNA metabarcoding analysis system. This system will be continuously updated in the future to ensure that recently discovered data can be used for actual forensic practice, and new techniques can be applied to improve the accuracy and efficiency of forensic biological analysis performed by forensic institutes as machine learning techniques develop. Furthermore, further researches on scientific and reasonable quantification will contribute to a significant improvement in the forensic evidentiary capacity and proof of non-human forensic biological evidence analysis results using this system.
- 발행기관:
- 대검찰청
- 분류:
- 과학기술과법