닫기
216.73.216.182
216.73.216.182
close menu
KCI 등재
한국어 튜터링 챗봇을 위한 말뭉치 구축의 필요성과 방법론
Construction of Corpus for Korean Tutoring Chatbot
김한샘 ( Hansaem Kim ) , 한지윤 ( Jiyoon Han ) , 최경호 ( Kyungho Choi ) , 정해영 ( Haeyoung Jung ) , 곽용진 ( Yongjin Kwak )
국제어문 75권 61-81(21pages)
DOI 10.31147/IALL.75.3
UCI I410-ECN-0102-2018-800-003755656

교수-학습 발화는 발화 턴 간에 규칙화된 인과관계가 강하고 자연 발화에서의 출현율이 낮으며, 일반적으로 어휘부, 표현 제시부, 대화부로 구성되고 커리큘럼과 화제를 고려하여 진행된다는 특징이 있다. 기존의 말뭉치는 이러한 교수-학습 발화의 특징을 반영하지 않았기 때문에 한국어 교육용 튜터링 챗봇을 개발하는 데에 활용도가 떨어진다. 이에 따라 이 논문에서는 자연스러운 언어 사용 수집, 도구 기반의 수집, 주제별 수집 및 분류, 점진적 구축 절차의 원칙에 따라 교수-학습의 실제 상황을 반영하는 준구어 말뭉치를 구축한다. 교실에서 발생하는 언어학습 상황을 시나리오로 구성하여 대화 흐름을 제어하고 채팅용 메신저와 유사한 형태의 도구를 통해 말뭉치를 구축한다. 이 연구는 한국어 튜터링 챗봇을 개발하기 위해 말뭉치 구축용 챗봇을 활용해 한국어 학습자, 한국어 교수자가 시나리오를 기반으로 발화문을 생성하는 준구어 말뭉치 구축 방법론을 제시한다는 데에 의의가 있다.

The teaching - learning utterance has a strong causal relationship between the utterance turns and a low occurrence rate in spontaneous utterances. Generally speaking, language resources composed of a vocabulary, a presentation unit, and a dialogue unit and constructed according to the curriculum and topic are needed. Since the existing corpus does not reflect the characteristics of this teaching - learning utterance, it is less useful for developing Korean tutoring chatbot. In this paper, we construct a quasi-spoken corpus that reflects the actual situation of teaching-learning according to the principles of natural language use collection, tool-based collection, subject collection and classification, and gradual construction procedure. The language learning situation in the classroom is constituted as a scenario to control the conversation flow and construct the corpus through a tool similar to the chat messenger. This study is significant in that it is the first time to build a quasi - spoken corpus that generates utterances based on scenarios of Korean learner and Korean instructor to develop Korean tutoring chatbot.

[자료제공 : 네이버학술정보]
×