본 연구는 만주어 문헌인 ≪滿文老檔(만문노당)≫ 태조편의 코퍼스를 단어 임베딩을 이용하여 분석함으로써 ≪滿文老檔≫ 태조편에 나타난 국가명과 물명의 특성을 규명하고, 국가명과 물명이라는 이질적인 대상에서 나타나는 결과가 어떤 차이를 보이는지에 대해 서도 밝히는 것을 목적으로 한다.
국가명을 보면, 명나라와 여진이 서로 큰 관련을 맺고 있는 반면에 조선과 몽골은 어휘 간 유사도가 두드러지게 높은 경우가 없다. 명나라에 대해서는 군사적 관계를 드러내는 어휘가 높은 유사도를 보이는 반면 여진과는 내정과 관련된 단어들이 높은 유사도를 보인다. 조선은 몽골과 명나라의 유사도가 높게 나타나며 사신이 자주 왕래했기 때문에 관련 어휘의 유사도가 높게 파악되었다. 몽골은 몽골인들이 여진에게 항복하거나 명나라와 여진 사이에서 배반하는 경우가 많았기 때문에 그와 관련된 어휘가 높은 유사도를 보였다.
물명을 보면, 국가명과는 달리 각 물명 사이의 관련성이 높지 않은 것으로 파악되었다. 담비 털가죽의 경우, 담비 털가죽으로 만드는 물품, 동물명, 직물 등이 높은 유사도를 보인다. 모청포는 대체로 직물명이 높은 유사도를 보이며, 색깔이나 함께 주고받는 물품이 유사도가 높은 것으로 파악되었다. 안장은 함께 묶이는 물품인 굴레가 매우 높은 유사도를 보인다. 또한 말과 관련된 어휘, 같은 부류의 상으로 주는 물품이 높은 유사도를 보이는 것으로 나타났다. 마지막으로 화살통의 경우, 활과 관련된 단어가 높은 유사도를 보였다. 그리고 무기나 함께 줄 때 비슷한 부류로 묶이는 물품의 유사도가 높게 나타났다.
국가명과 물명이 보이는 서로 다른 특성은 t-SNE를 통한 시각화로 확인할 수 있다. 국가명은 서로 비슷한 개념으로 묶을 수 있지만 물명은 독립적으로 존재한다. 따라서 국가명은 한 부분에 집중적으로 분포하지만, 물명은 분산되어 있는 것을 확인할 수 있다.
The purpose of this study is to identify the characteristics of country names and product names in Manwen laodang Taidzu, and to reveal the differences in results from disparate products such as country names and product names by analyzing Manchu corpus of Manwen laodang Taidzu. We performed analysis of the Manchu corpus using GloVe, a word embedding method.
In the case of country names, while the Ming Dynasty and Jurchen are closely related to each other, the lexical similarity between Joseon and Mongolia is not particularly high. For the Ming Dynasty, vocabulary revealing military relations shows high similarity, while for the Jurchen Dynasty, words related to internal affairs show high similarity. It is understood that Joseon has a high degree of similarity between Mongolia and the Ming Dynasty. In addition, because the envoys from Joseon to Jurchen often came and went, the related vocabulary showed a high degree of similarity. In Mongolia, there were many cases of Mongolians surrendering to the Jurchens and betraying the Ming Dynasty and the Jurchens, so the vocabulary related to them showed a high degree of similarity.
In the case of product names, unlike country names, the characteristics of each product name were revealed individually. In the case of marten fur, the items made from marten fur, animal names, and fabrics show a high degree of similarity. The fine smooth cotton(mocin) was found that the fabric name generally showed a high degree of similarity. Saddles show a very high degree of similarity in the bridle. In addition, words related to horses and items given as prizes of the same type were found to show a high degree of similarity with saddles. Lastly, in the case of quiver, words related to bows showed high similarity with it.
The different characteristics of country names and product names can be confirmed through visualization through t-SNE. Country names can be grouped into similar concepts, but product names are distributed independently. Therefore, it can be seen that country names are concentrated in one place, but product names are dispersed.