18.97.14.85
18.97.14.85
close menu
Accredited
『우리말샘』 최근 등재어의 형태·의미적 특성과 텍스트 장르별 출현 빈도 분석
On the Recent Inclusions in the Dictionary Urimalsaem: An Analysis of their Morpho-semantic Characteristics and Occurrence Frequency by Text Genre
안진산 ( An Jinsan ) , 성민규 ( Sung Minkyu ) , 이수진 ( Lee Soojin )
언어사실과 관점 vol. 59 125-162(38pages)
UCI I410-ECN-151-24-02-088724701

이 연구의 목적은 최근 『우리말샘』에 등재되는 어휘 항목의 특징들을 분석하여 『우리말샘』의 최근 등재 경향성을 비판적으로 살펴보는 데 있다. 이를 위해 『우리말샘』에 2020년 7월 1일부터 2021년 6월 30일까지 1년 동안 등재된 어휘 항목들을 대상으로 어휘의 형태·의미적 특성을 분석하고, 2019~2021년 사이에 생성된 대량의 말뭉치에서 『우리말샘』 최근 등재 어휘 항목들이 실제로 사용된 양상을 관찰한다. 분석 결과, 최근 『우리말샘』에는 구 단위, 고유명사 부류, 전문어가 단어, 일반명사, 일상어보다 더 높은 비율로 등재되고 있는 경향이 있었다. 어휘의 실제 사용 양상을 분석했을 때는, 고유명사 부류 및 전문어 성격의 일부 최근 등재어들은 기사문(본문, 댓글), 영상 댓글, 메신저 대화에서 실제 사용예가 관찰되지 않았으며, 다른 텍스트 장르에 비해 기사문 본문에서 배타적으로 사용되는 어휘들이 최근 등재어에서 높은 비중을 차지하고 있음을 알 수 있다. 『우리말샘』의 최근 표제어 등재가 균형적·체계적으로 확장되고 있다기보다는 특정 의미 부류, 특정 사용역의 어휘들을 중심으로 이루어지고 있는 이러한 경향성은 ‘사용자 참여형 사전’인 『우리말샘』의 한계를 반증하는 것이며, 앞으로 『우리말샘』이 보완되어야 할 부분이 무엇인지 시사한다.

This paper looks into the lexical items that have recently been added to Urimalsaem and evaluates the dictionary’s recent inclusion trends. To this end, we analysed the morphological and semantic characteristics of the lexical items that were included in Urimalsaem from 1 July 2020 to 30 June 2021 and examined their use in a large-scale corpus compiled between 2019 and 2021. The analysis showed that phrase units, proper noun classes, and specialised terms tended to be included in the dictionary at a higher rate than word units, common nouns, and common words. Regarding usage, it appeared that some of the included items from the proper noun and terminology categories were not in use in news articles (whether main text or comments), YouTube comments, and instant messaging chats. In addition, lexical items exclusively used in news articles were far more frequently included in the dictionary compared to other text genres. This shows that the recent inclusion of headwords in Urimalsaem has not been carried out in a balanced and systematic way; instead, there is a tendency to focus on vocabulary of specific semantic categories and specific use contexts, which is indicative of the limitations of Urimalsaem as a ‘user-generated content dictionary’. Ultimately, the results of this study point to the improvements that are yet to be made in the dictionary Urimalsaem.

1. 서론
2. 연구 대상 및 방법
3. 최근 등재어의 형태·의미적 특성
4. 최근 등재어의 텍스트 장르별 출현 빈도 특성
5. 결론
참고문헌
[자료제공 : 네이버학술정보]
×