Effective Representation Method of Training Data for Automatic Korean Word Spacing System
1. 서 론 2. 효과적인 띄어쓰기 학습 데이터 구성 3. 실험 및 평가 4. 결 론 REFERENCES
인공지능이 한국어 텍스트의 의미를 정확히 파악하기 위해서는 텍스트의 띄어쓰기 오류 교정 혹 은 자동 띄어쓰기를 통한 어절 인식의 과정이 필요하다. 최근 심층학습 기술이 발달하면서 심층학습을 자동 띄어쓰기 문제에 적용하는 연구들이 많아지고 있다. 이를 위해서는 한국어 문장을 고정 길이 시퀀스로 변환하여 심층 신경망의 입력으로 전달하여야 한다. 본 연구는 심층학습이 띄어쓰기 패턴을 효과적으로 학습하기 위해서 심층학습의 입력으로 주어지는 학습 데이터를 어떻게 표현하는 것이 적 절한지를 실험을 통하여 검토하였다. 실험 결과 입력 시퀀스를 생성하는 방법과 띄어쓰기 정보를 태깅하는 방법이 심층학습의 성능에 영향을 미친다는 점을 확인하였다. 띄어쓰기에는 상대적으로 앞쪽 음절 문맥이 더 중요하므로 문장의 앞쪽 중심으로 입력 시퀀스를 구성하는 것이 좋은 결과를 보였으며, 각 음절이 어절 경계 인식에서 갖는 역할을 더욱 명확히 표현하여 음절열의 부족한 문맥을 보완 하는 것이 심층학습에 도움이 되었다.
In order for AI to accurately grasp the meaning of Korean text, it is necessary to rec-ognize the word by correcting the spacing of the text or by automatically spacing. Recently, with the development of deep learning techniques, there are a lot of studies that apply deep learning to the automatic word spacing problem. To this end, Korean sentences must be converted into fixed-length sequences and transmitted as input to deep neural networks. Experimental results show that the method of generating the input sequence and the tagging of the spacing information affect the performance of the deep learning. Since the left context is more important for spacing, it was good to construct the input sequence around the front of the sentence. It was helpful to express the role of each syllable in word boundary recognition more clearly to compensate for the insufficient context of syllable sequence.
한국학술정보㈜의 모든 학술 자료는 각 학회 및 기관과 저작권 계약을 통해 제공하고 있습니다.
이에 본 자료를 상업적 이용, 무단 배포 등 불법적으로 이용할 시에는 저작권법 및 관계법령에 따른 책임을 질 수 있습니다.
간행물명 | 수록권호 |
---|---|
|
21권 4호 ~ 21권 4호 |
|
9권 12호 ~ 9권 12호 |
|
9권 12호 ~ 9권 12호 |
|
16권 6호 ~ 16권 6호 |
|
9권 11호 ~ 9권 11호 |
|
9권 11호 ~ 9권 11호 |
|
16권 5호 ~ 16권 5호 |
|
9권 10호 ~ 9권 10호 |
|
9권 10호 ~ 9권 10호 |
|
21권 3호 ~ 21권 3호 |
|
9권 9호 ~ 9권 9호 |
|
9권 9호 ~ 9권 9호 |
|
16권 4호 ~ 16권 4호 |
|
9권 8호 ~ 9권 8호 |
|
9권 8호 ~ 9권 8호 |
정보처리학회지 |
27권 1호 ~ 27권 1호 |
|
9권 7호 ~ 9권 7호 |
|
9권 7호 ~ 9권 7호 |
|
16권 3호 ~ 16권 3호 |
|
21권 2호 ~ 21권 2호 |
자료제공: 네이버학술정보 |
---|
자료제공: 네이버학술정보 |
---|
본 자료는 원문파일이 존재하지 않거나 서비스를 위한 준비 중입니다.
빠른 시일 내에 서비스할 수 있도록 노력하겠습니다.
관련문의사항은 kiss@kstudy.com 으로 연락주시기 바랍니다.
감사합니다.
개인회원가입으로 더욱 편리하게 이용하세요.
아이디/비밀번호를 잊으셨나요?