본 연구는 언어학과 관련하여 기계 번역의 역사를 살펴보고, 규칙 기반 기계 번역과 자료 기반 기계 번역의 알고리듬을 간략히 소개한다. 또한 이를 통해 한문학 텍스트의 기계 번역에 대한 제안과 전망을 하는 것이 본 연구의 목적이다. 기계 번역은 컴퓨터를 이용하여 하나의 언어를 다른 언어로 자동으로 변환하는 기술인데, 최근 인공 지능(AI)과 전산언어학 분야에서 활발히 연구되고 있다. 기계 번역은 Weaver(1949)에서 출발하였으며, 1980년대 초까지 언어학의 영향으로 어휘, 문법, 의미 생성에 필요한 많은 규칙을 적용한 시스템인 규칙 기반 기계 번역이 발전하였다. 1980년대 이후에는 컴퓨터의 발달과 대규모 코퍼스(corpus)의 구축이 가능해지면서 코퍼스를 기계 번역에 이용하려는 시도들이 나타났는데, 코퍼스를 기반으로 하는 자료 기반 기계 번역이 발전하였다. 최근에는 딥러닝(deep learning)을 통한 기계 번역의 인기가 매우 높아지고 있다. 그 중 주목받고 있는 기술은 ‘신경망 기계 번역(Neural Machine Translation)’이다. 그런데 한문학 텍스트는 어휘와 문법에 대한 정확한 정의와 분류가 합의된 상황도 아닐 뿐만 아니라 이를 규칙화한 시스템도 구축하지 못한 상황이기 때문에 규칙 기반 기계 번역을 활용하기 어렵다. 한편 충분한 병렬 코퍼스도 부족하기 때문에 통계적 기계 번역이나 신경망 기계 번역을 활용하기도 어렵다. 따라서 현재 한문학 텍스트의 기계 번역에서 가장 합리적인 방법은 번역 메모리를 활용하는 방법이다. 이를 통해 현재 한문학 텍스트의 번역에 대한 시간과 비용을 최소화 할 수 있고, 향후 신경망 기계 번역에서 필요로 하는 대용량의 병렬 코퍼스를 생성해 낼 수 있을 것이다.
This study examines the history of machine translation in relation to linguistics and briefly introduces algorithms for rule based machine translation and data based machine translation. And the purpose of this study is to propose and prospect a machine translation of Korean texts in classical Chinese. Machine translation is a technology that automatically transforms a language into another language. Recently, it has been actively researched in artificial intelligence(AI) and computational linguistics. Machine translation started with Weaver(1949), and until the early 1980’s, rule based machine translation developed which is a system that applied many rules for vocabulary, grammar, and meaning. Since the 1980’s, the attempts using corpus for machine translation come up with computer development and large corpus construction, then data base machine translation has developed. In recent years, the machine translations with AI has become very popular. One of them is ‘Neural Machine Translation’. However, it is difficult to use rule based machine translation because it is not the agreed-on situation about vocabulary and grammar on Korean literature text in classical Chinese. Also, since there are not enough parallel corpora, it is difficult to use statistical machine translation or neural machine translation. Therefore, the most reasonable method of machine translation on Korean literature text in classical Chinese is to use ‘translation memory’. It is possible to minimize the time and cost for translating the current Korean literature text in classical Chinese, and to generate a large amount of parallel corpus which is required in neural network machine translation in the future.