닫기
216.73.216.214
216.73.216.214
close menu
KCI 등재
유니코드 한자-한글 자동 변환 연구 및 구현
A Study and Implementation of Automatic Unicode Hanja to Hangul Conversion
이도길 ( Lee Do-gil )
한성어문학 51권 1-28(28pages)
UCI I410-151-25-02-091365999

텍스트의 가독성과 검색의 용이성을 위해 한자를 한글로 변환하여 병기하는 것이 바람직하다. 본 논문은 유니코드 텍스트에서의 문자 정규화에 대해 논하고 한자-한글 변환을 위해 필요한 언어 정보로서 한자-한글 테이블과 한자어-한글 사전을 구축하였다. 한자 음가 사전으로부터 한자-한글 테이블을 정의하고 우리말샘 사전으로부터 추출한 약 48만 개의 어휘를 포함하는 한자어-한글 사전을 구축하였다. 최장일치 알고리즘에 기반하여 두음법칙 및 예외 규칙 등을 적용한 자동 한자-한글 변환 시스템을 구현하였다. 1970년~2019년까지의 동아일보 코퍼스를 대상으로 구현한 시스템과 문자 단위의 변환 방법의 결과를 비교하였다.

For the readability and ease of search of text, it is desirable to convert Hanja (Chinese characters) into Hangul (Korean characters) and write them together. This paper discusses the normalization of characters in Unicode texts and constructed a Hanja-Hangul table and Hanja word dictionary as language information necessary for Hanja to Hangul conversion. The Hanja-Hangul table was defined from the Chinese character phonetic dictionary and the Hanja word dictionary including about 480,000 vocabularies was constructed which were extracted from Korean language dictionary named Urimalsaem. Based on the longest matching algorithm with applying the initial law and some exception rules, an automatic Hanja-Hangul conversion system was implemented. I executed the system in the Dong-A Ilbo corpus from 1970 to 2019 and compared the results of the system and those of character unit conversion method.

〈국문초록〉
1. 서론
2. 한자-한글 변환을 위한 언어 정보
3. 한자-한글 변환 방법 및 구현
4. 실험 및 결과
5. 결론 및 향후 연구
〈참고문헌〉
(Abstract)
[자료제공 : 네이버학술정보]
×