애스크로AIPublic Preview
← 학술논문 검색
학술논문기업경영리뷰2025.05 발행

데이터 레코드 자연어 변환을 위한 Few-Shot 프롬프팅

Few-Shot Learning for Natural Language Translation of Data Records

맹승렬(국립공주대학교); 유대상((주)엘콤텍); 강애띠(㈜한컴인스페이스); 박동진(국립공주대학교)

16권 2호, 237~251쪽

초록

최근 자연어 처리(NLP)의 혁신적 진보는 생성형 인공지능(Generative AI)과 대규모 언어 모델(Large Language Models, 이하 LLM)의 발전에 크게 기인한다. 특히, GPT-3와 같은 초거대 언어 모델은 소량의 예시(few-shot examples)만으로도 다양한 자연어 생성 작업을 수행할 수 있는 뚜렷한 능력을 보이고 있다(Brown, 2020). 이러한 생성형 AI 기술은 기존의 ICT 응용 환경에도 많은 영향을 미치고 있다. 대표적으로 정부 및 민간 부문의 각종 정보가 자연어로 서비스되는 사례가 빈번해지고 있으며 이러한 추세는 더욱 가속화될 것이다. 본 논문에서는 데이터 레코드를 자연어로 변환하는 방법을 다룬다. 데이터베이스는 전통적 ICT의 근간이고, 다양한 레코드를 포함하기 때문에 데이터 레코드의 자연어 변환 기술은 기존 ICT와 생성형 AI를 융합하는데 있어 중요한 요소이다. 퓨샷-학습이 자연스럽고 일관성 있는 자연어 변환에 유용하다는 주장을 실증적 사례를 통해 제시한다. 객체중심 퓨샷과 속성중심 퓨샷, 두 가지 접근 방법을 제시하고 후자가 자연스러움과 확장성 면에서 더 유리함을 보인다. 자연스러운 변환을 위해 두 접근방법은 체인닝으로 연결되는 2단계 재변환 과정을 거칠 수 있다.

Abstract

Recent advances in natural language processing (NLP) have been largely driven by the development of generative AI and large language models (LLMs). In particular, LLMs such as GPT-3 demonstrate the ability to generate coherent natural language using only a few-shot examples (Brown, 2020). This generative AI technology is significantly transforming the existing ICT environment. Natural language-based services for information access are becoming increasingly common in both the public and private sectors, and this trend is expected to accelerate further. In this paper, we propose a method for translating structured data records into natural language. Since databases form the foundation of existing ICT systems and contain numerous structured records, they serve as a critical link for integrating traditional ICT with generative AI technologies. We argue that few-shot learning can effectively translate data records into natural and semantically consistent texts. We propose two approaches—an object-centered and an attribute-centered method—and demonstrate through real examples that the latter yields more natural text and offers greater scalability. To further improve fluency and coherence, both approaches can be enhanced through a secondary translation process, such as chained reconversion or text chaining.

발행기관:
KNU 기업경영연구소
분류:
경영학일반

AI 법률 상담

이 논문의 주제에 대해 더 알고 싶으신가요?

460만+ 법률 자료에서 관련 판례·법령·해석례를 찾아 답변합니다

AI 상담 시작
데이터 레코드 자연어 변환을 위한 Few-Shot 프롬프팅 | 기업경영리뷰 2025 | AskLaw | 애스크로 AI