임베딩 기반 유사도 측정을 통한 수입 물품의 HS 코드 추천 시스템
HS Code Recommendation System for Imported Goods Based on Embedding-Based Similarity Measurement
김형욱((주)데이터월드); 김건우(국립한밭대학교); 최근호(국립한밭대학교)
27권 3호, 31~50쪽
초록
최근 AI 기술, 특히 ChatGPT와 같은 대규모 언어 모델(LLM)은 인간과 기계 간 상호작용에 큰 변화를가져왔다. 이러한 AI 모델은 자연어를 이해하고 다양한 데이터 형식을 처리하며 명령을 실행할 수있다. 한편, 전자상거래와 국제 무역의 급속한 확장으로 인해 세관 당국의 업무량이 증가하면서 정확한HS 코드 분류는 공정한 관세 부과를 위해 필수적이다. 하지만 수작업 분류는 전문가의 지식이 필요하여시간과 비용 측면에서 비효율적일 수 있다. 본 연구에서는 SBERT을 활용한 자동 HS 코드 추천 시스템을제안하였다. SBERT 기반 임베딩을 통해 법령 및 해설서 등 원천 데이터와 테스트 데이터 간 유사도를측정하여 추가 학습 없이 HS 코드를 추천하는 방식이다. 또한, 실제 사례 데이터를 활용한 비교 분석을수행하였다. 다양한 SBERT 모델을 적용하여 모델 및 데이터 특성에 따른 정확도를 평가하고, 기존연구에서 제기된 지속적인 학습 요구와 클래스별 제약 문제를 해결할 방안을 제시하였다. 본 연구의결과는 AI 기반 HS 코드 분류 및 검색 시스템에 적용되어 세관 행정 업무의 효율성을 높이는 데기여할 것으로 기대된다.
Abstract
Recently, AI technologies, especially large language models (LLMs) like ChatGPT, have significantly transformed human-machine interactions. These AI models understand natural language, process diverse data formats, and execute commands. Meanwhile, the rapid expansion of e-commerce and international trade has increased the workload of customs authorities, making accurate HS code classification crucial for fair tariff imposition. However, manual classification requires expert knowledge, leading to inefficiencies in time and cost. This study proposes an automatic HS code recommendation system using SBERT, an LLM-based embedding model, to measure similarity between source data (laws, explanatory notes) and test data without additional training. Comparative analyses were conducted using real-world cases. By applying different SBERT models, this study evaluates accuracy based on model and data characteristics. It addresses challenges such as continuous training requirements and class-specific constraints, offering methodologies to enhance accuracy. The findings are expected to improve customs administration efficiency by supporting AI-driven HS code classification and search systems.
- 발행기관:
- 한국경영정보학회
- 분류:
- 경영학