닫기
216.73.216.115
216.73.216.115
close menu
KCI 등재
국어 텍스트 분석 프로그램(KReaD 지수)의 개발
Development of the Korean Language Text Analysis Program (KReaD Index)
조용구 ( Gho Yonggu ) , 이경남 ( Lee Gyeongnam )
독서연구 56권 225-245(21pages)
DOI 10.17095/JRR.2020.56.8
UCI I410-ECN-0102-2021-000-001033223

본 연구는 국어 텍스트를 분석 프로그램(KReaD 지수)을 개발하는 것에 목적이 있다. 개발을 위해 텍스트 분석 프로그램과 관련된 국외의 영어권 텍스트 분석 연구를 검토하였다. 검토한 결과를 바탕으로 어휘 등급 목록을 구축하고 R을 기반으로 한 텍스트 분석 프로그램을 개발하였다. 텍스트 난이도 분석에 활용되는 어휘 목록은 빈도 지표, 분산 지표를 활용하여 등급화했으며, 28,332 단어를 1~10등급으로 목록화했다. 텍스트 분석 프로그램은 R을 기반으로 구동하였으며, 분석 결과로 문단 수, 문장 수, 단어 수, 평균문장길이, 어려운단어비율, 문장구조점수, 학년수준, KReaD 점수, 타입토큰비율, 단문의비율, 복문의 비율 등을 확인할 수 있다. 그리고 텍스트를 시각화한 워드클라우드, 네트워크 분석 결과도 확인할 수 있도록 구성하였다. 텍스트 분석 프로그램의 KReaD지수는 텍스트의 난이도 점수로 0~2000점 구간에서 제시된다. 본 연구에서 개발한 텍스트 분석 프로그램은 추후 교재, 교과서, 평가 도구의 텍스트 선정에서 활용할 수 있으며, 분석 방법을 응용하여 Coh-Metrix처럼 서사성, 정보성, 응집성 등을 분석할 수 있는 도구로 활용이 가능하다. 본 연구 결과는 독자에게 적합한 텍스트 선정 분야에 도움을 줄 것으로 기대한다.

This study aims to develop a Korean text analysis program (KReaD index). To this end, foreign English-speaking text analysis studies related to the text analysis program were reviewed. Using the results of the review, a list of vocabulary grades was established, and a text analysis program based on R was developed. The vocabulary list used for text difficulty analysis was graded using frequency and variance indicators, and 28,332 words were listed for grades 1 to 10. The text analysis program used R, and the analysis results indicate the number of paragraphs, number of sentences, number of words, average length of sentences, difficult word rate, sentence structure score, grade level, KReaD score, type-tokens ratio, short sentence ratio, and double sentence ratio. Additionally, a word cloud visualizing the text and a network analysis checked the results. The KReaD index of the text analysis program was presented in 0- to 2000-point intervals according to the difficulty score of the text. The text analysis program developed in this study can be used in the text selection of textbooks and evaluation tools and can be used as a tool to analyze whether a text is narrative, informational, cohesive, and so on, similar to the Coh-Metrix, by applying the analysis method. The results of this study are expected to help readers in the field of text selection.

1. 서론
2. 선행연구
3. 연구결과
4. 결론
[자료제공 : 네이버학술정보]
×