논문 상세보기

한국독서학회> 독서연구> 텍스트 마이닝을 활용한 단일 텍스트의 내용 구조분석 방안 탐색

KCI등재

텍스트 마이닝을 활용한 단일 텍스트의 내용 구조분석 방안 탐색

A Study on the Analysis Method Using Text Mining in the Content Structure of Single Text

길호현 ( Kil Hohyun )
  • : 한국독서학회
  • : 독서연구 52권0호
  • : 연속간행물
  • : 2019년 08월
  • : 91-134(44pages)

DOI

10.17095/JRR.2019.52.3


목차

1. 서론
2. 이론적 배경
3. 단일 텍스트 분석 과정
4. 시각화 분석 결과
5. 논의 및 결론

키워드 보기


초록 보기

본 연구는 단일 텍스트의 내용 구조를 시각적으로 표시하기 위해 텍스트 마이닝의 네트워크 분석 방법을 사용할 수 있는 가능성을 점검하였다. 이를 위해 한 편의 텍스트를 문단 단위로 분할하는 방법과 문장 단위로 분할하는 방법을 각각 시도하여 그 결과를 비교하였다. 또한 TF*IDF 값을 가중치로 반영하는 경우와 그렇지 않은 경우도 비교하였다. 분석 결과 문단 단위로 분할할 때 의미의 연결성을 파악하기가 수월했고, 문장 단위로 분할할 때 의미의 구분을 파악하기가 수월했다. TF*IDF 값은 핵심어 선정에서는 유용했고 네트워크 관계도 생성에서는 유용하지 않았다.
The study examined the possibility of using the keyword network method among text mining analysis techniques to visualize the content structure of a single text. The method of splitting a single text into paragraphs and sentences was checked. While the organic meaning of text is more evident in paragraph unit splitting, the more clearly the distinction of meaning in sentence unit splitting. The TF*IDF weights were useful in selecting the keywords in the splitting of paragraphs, but were not helpful in calculating the content network structure of text.

UCI(KEPA)

I410-ECN-0101-2019-000-001010889

간행물정보

  • : 사회과학분야  > 기타(사회과학)
  • : KCI등재
  • :
  • : 계간
  • : 1598-9607
  • :
  • : 학술지
  • : 연속간행물
  • : 1996-2019
  • : 550


저작권 안내

한국학술정보㈜의 모든 학술 자료는 각 학회 및 기관과 저작권 계약을 통해 제공하고 있습니다.

이에 본 자료를 상업적 이용, 무단 배포 등 불법적으로 이용할 시에는 저작권법 및 관계법령에 따른 책임을 질 수 있습니다.

발행기관 최신논문
| | | | 다운로드

1미디어 시대의 책맹(비독서) 현상과 독서 교육의 방향

저자 : 김혜정 ( Kim Hye-jeong )

발행기관 : 한국독서학회 간행물 : 독서연구 52권 0호 발행 연도 : 2019 페이지 : pp. 9-49 (41 pages)

다운로드

(기관인증 필요)

초록보기

이 연구의 목적은 최근 발전된 미디어 환경에 의해 학습자들의 문식 환경도 크게 변화함에 따라 글을 읽을 수 있음에도 자발적으로 책을 읽지 않는 책맹(aliteracy)또는 의사문맹 현상이 일어나는 점을 주목하고, 중등 학생들을 중심으로 책맹의 실태를 조사하고, 그 원인을 다각도로 조망함으로써 책맹에 대한 학문적, 정책적 관심을 유도하는 데 있다. 이를 위해 우선 책맹에 대한 선행 연구들을 검토하여, 책맹이 읽기 태도와 관련됨을 논거하고, 단순히 책맹을 문제로 볼 것만이 아니라, 미디어 사회에서 다양한 미디어 중에 하나로 받아들일 수밖에 없음을 비판적으로 성찰하였다. 또한 지역 내 교육열 편차를 고려하여 시도, 중고등학생 각각 115명, 124명을 대상으로 임의 표집하여 책맹의 실태와 미디어 간의 상관성을 살펴보았고, 고등학생 115명을 대상으로 독서 동기를 보다 심층적으로 조사하였다. 그 결과, 책맹과 미디어 활용 시간 간의 상관성은 낮으며, 오히려 책을 읽지 않는 이유가, 책이 재미가 없다거나 어렵다는 반응이 가장 많아, 책 자체에 대한 이유를 중요하게 들고 있다. 이러한 결과들은 몇 가지 교육적 시사점을 제공해주었는데, 그것은 독서가 무조건 중요하다는 봉건적 가치를 학생들에게 강요할 수는 없으며, 오히려 책(전자책을 포함하여 긴 독서 호흡을 요하는 책)은 소비자에게 어필하는 다양한 미디어 중에 하나로서 경쟁해야 한다는 것이다. 이를 위해 교사는 교사 자신이 아닌 학생의 눈높이에 맞는 책을 선정해야 하며, 책은 학생 독자가 흥미롭게 느낄 만한 주제와 그들이 쉽게 다가갈 수 있는 이독성 수준과 독자로서 소비자가 구매욕을 불러일으킬 수 있는 미디어 형식을 갖추도록 변화되어야 한다.

221세기 중등학교 독자를 위한 '읽기 교육 목표 분류학' 서설

저자 : 김종윤 ( Kim Jong-yun )

발행기관 : 한국독서학회 간행물 : 독서연구 52권 0호 발행 연도 : 2019 페이지 : pp. 53-89 (37 pages)

다운로드

(기관인증 필요)

초록보기

과거의 읽기 능력의 척도는 교과서나 시험에 제시된 글 한편을 얼마나 정확하게 이해하고 있는지와 관련이 있었다. 정보 통신 기술의 발달과 이에 따른 사회의 변화로 인해 오늘날의 사회에서는 학생들에게 그 이상의 읽기 능력을 요구한다. 예를 들어, 사회에서 요구하는 성공적 독자는 자신의 목적에 맞게 다양한 출처와 유형의 텍스트를 인터넷과 도서관에서 수집, 비교, 평가, 종합하여 읽을 수 있어야 한다. 이와 같은 읽기 능력에 대한 새로운 사회적 요구는 읽기의 개념역의 확장과 함께 읽기 교육에 대한 새로운 이론적 틀의 필요성을 제기한다. 이 연구의 목적은 이와 같은 사회의 변화를 고려하여 오늘날 중등학생(중·고등학생을) 위한 새로운 읽기 교육 목표 분류학을 제안하는 데 있다.
이를 위해 먼저 우리나라 중고등학생들은 읽기 발달상 어느 단계에 속하는지, 교육과정상 어떤 교육을 받는지 등을 비판적으로 살펴보았다. 그다음으로 21세기 중등학교 독자의 읽기 능력에 대한 사회적 요구와 국외 사례의 읽기 교육이 어떠한지를 살펴보았다. 이와 같은 조사를 바탕으로, 본 연구에서는 '독자의 인지적 기능 및 전략 차원' 및 '텍스트 유형'의 2차원으로 구성된 읽기 목표분류학을 제안하였다. 인지적 기능·전략 차원에서는 정보 탐색, 내용 확인, 분석 및 추론, 종합 평가, 점검과 조정의 6가지 범주를 제시하였으며, 텍스트유형에서는 전통적 읽기, 시각자료 읽기, 다문서 읽기, 디지털 읽기의 4가지 범주를 제시하였다. 이 분류학을 통해 기존의 읽기 교육을 비판적으로 고찰함과 동시에 앞으로의 읽기 교육 방안에 관한 제언을 제시하였다.

3텍스트 마이닝을 활용한 단일 텍스트의 내용 구조분석 방안 탐색

저자 : 길호현 ( Kil Hohyun )

발행기관 : 한국독서학회 간행물 : 독서연구 52권 0호 발행 연도 : 2019 페이지 : pp. 91-134 (44 pages)

다운로드

(기관인증 필요)

초록보기

본 연구는 단일 텍스트의 내용 구조를 시각적으로 표시하기 위해 텍스트 마이닝의 네트워크 분석 방법을 사용할 수 있는 가능성을 점검하였다. 이를 위해 한 편의 텍스트를 문단 단위로 분할하는 방법과 문장 단위로 분할하는 방법을 각각 시도하여 그 결과를 비교하였다. 또한 TF*IDF 값을 가중치로 반영하는 경우와 그렇지 않은 경우도 비교하였다. 분석 결과 문단 단위로 분할할 때 의미의 연결성을 파악하기가 수월했고, 문장 단위로 분할할 때 의미의 구분을 파악하기가 수월했다. TF*IDF 값은 핵심어 선정에서는 유용했고 네트워크 관계도 생성에서는 유용하지 않았다.

4아동·청소년기의 독서 정체 이유에 관한 연구 : 대학생의 독서 경험 회고담을 중심으로

저자 : 이지영 ( Lee Ji Young )

발행기관 : 한국독서학회 간행물 : 독서연구 52권 0호 발행 연도 : 2019 페이지 : pp. 135-166 (32 pages)

다운로드

(기관인증 필요)

초록보기

이 연구에서는 독자 스스로 독서가 부진한 상태가 일정 기간 지속되어 독서량이나 독서 태도가 낮았다고 인식한 시기를 '독서 정체'로 보고, 독서 정체가 나타나는 이유를 대학생의 독서 경험 회고담을 통해 살펴보았다.
독서 정체의 이유를 학교급별로 살펴보면 다음과 같다. 1)초등학생: 문식성 후원자인 부모와의 갈등, 독서 공간과의 멀어짐, 긴 글에 대한 두려움. 2)중학생: 읽기 동기 결여, 선호 장르 및 도서의 발견, 학업과 독서와의 갈등, 독서를 둘러싼 또래와의 사건. 3)고등학생: 학업으로 인한 독서의 부재, 입시를 위한 독서, 독서에 대한 부정적 시선.
독서 정체는 개별 독자의 경험에 따라 학교급에 따라 다르게 나타나며, 여러 요인이 복합적으로 작용한다. 독서 정체는 책을 읽는 독서 행위와 관련되며 독서 인식과 같은 심리적 이유와도 관련된다. 독서 정체 경험을 회고하는 과정은 독서에 대한 성찰의 기회가 된다는 점에서 독서교육적 의미를 가진다.

5차세대 읽기 평가의 방향 탐색 : GISA 평가틀과 읽기 수행 중재요인 분석을 중심으로

저자 : 박혜영 ( Hye-young Park )

발행기관 : 한국독서학회 간행물 : 독서연구 52권 0호 발행 연도 : 2019 페이지 : pp. 167-198 (32 pages)

다운로드

(기관인증 필요)

초록보기

본 연구에서는 차세대 읽기 평가의 특징을 보이고 있는 GISA를 분석하여 새로운 읽기 평가의 방향을 탐색하고, 향후 우리나라 읽기 평가 개선 및 차세대읽기 평가의 방향에 대한 시사점을 얻고자 하였다. 광역(Global), 통합형(Integrated), 시나리오 기반 평가(Scenario-based Assessment)로 개발된 GISA는 디지털 시대가 요구하는 읽기 능력을 측정하기 위해 기존의 읽기 능력구인을 확장했다는 특징이 있다. 또한 '학습을 위한' 읽기 평가를 지향하면서 평가의 결과를 통해 학생의 발달과 교수학습 개선에 필요한 정보를 얻을 수 있도록 읽기 수행의 중재요인을 설정, 평가도구를 설계했다는 점도 특징적이다.
이러한 GISA 평가의 특징은 앞으로 우리나라 읽기 교육 및 평가를 개선하는데, 그리고 앞으로 진일보한 읽기 평가도구 개발에 다음과 같은 시사점을 줄 수 있다. 첫째, 확장된 읽기 구인은 시대적 필요성과 요구를 반영한 것으로, 우리나라에서도 국가교육과정에서 해당 요인이 반영되어 있는지 검토하고 학습 요소를 확장, 보완하는 작업이 이루어져야 한다. 둘째, 학습 결과에 대한 평가와 함께 학습 과정에 대한 진단적이고 형성적인 평가를 통해 학생의 발달과 교수학습에 도움을 줄 수 있는 평가를 구안해야 할 것이다. 셋째, 텍스트 중심의 읽기 평가에서 확장하여 학생의 동기와 몰입도를 높일 수 있도록 시나리오 기반 평가와 같은 새로운 형태의 평가 방식이 연구되어야 한다.

6토픽 모델링을 활용한 페미니즘 텍스트 읽기에 나타난 독자 담론 분석 : 소설 82년생 김지영을 중심으로

저자 : 최숙기 ( Choi Sook Ki )

발행기관 : 한국독서학회 간행물 : 독서연구 52권 0호 발행 연도 : 2019 페이지 : pp. 199-239 (41 pages)

다운로드

(기관인증 필요)

초록보기

본 연구에서는 페미니즘 이슈에 관한 주요 공론장으로 기능하는 페미니즘 독서 모임에 참여한 독자들이 페미니즘 서적-이후적 독서 과정에서 생산한 담론 분석을 실시하고자 하였다. 이에 페미니즘 서적을 읽고 독서 토론을 수행한 이후 성인 독자 48명이 산출한 독후 에세이를 대상으로 토픽 모델링방법 중하나인 LDA (Latent Dirichlet allocation) 분석을 적용하였다. 분석 결과는 다음과 같다. 첫째, 단어 빈도(TF) 분석 결과에 따르면 <82년 김지영> 소설이 1982년 출생한 30대 '김지영'이라는 여성 인물을 통해 한국 여성들이 경험한 성차별 문제를 페미니즘 독서 토론의 과정에서 일반적으로 표상하는 것으로 나타났다. 둘째, TF-IDF 분석 결과에 따르면 모든 독자 집단에서 페미니즘 독서 토론에 대한 논의가 이루어졌고, 여성 독자는 '성차별'이란 단어를 더 명확히 사용하였고 '군대'와 관련한 군가산점 제도 논의를 하였고 '약자'라는 단어를 빈번하게 사용하였다. 남성 독자는 '통계', '사실', '단편적', '부분', '편향'이라는 용어를 빈번히 사용하여 82년생 김지영 소설의 사실성 문제를 주되게 논의하는 것으로 나타났다. 셋째, LDA 기반 토픽 모델링 결과 여성 취업 불평등, 여성 성차별 경험, 소설 사실성 유무, 페미니즘 토론,젠더 갈등의 심화나 해소 등의 10개의 토픽(주제)들이 도출되었다.

1
주제별 간행물
간행물명 수록권호

KCI등재

세계지역연구논총
37권 4호 ~ 37권 4호

KCI등재

정보화정책
26권 4호 ~ 26권 4호

KCI등재

환경정책
27권 0호 ~ 27권 4호

KCI등재

인문사회 21
10권 6호 ~ 10권 6호

KCI등재

사회사상과 문화
22권 4호 ~ 22권 4호

편집학연구
1권 0호 ~ 1권 0호

한국예다학
8권 0호 ~ 8권 0호

경상논집
39권 1호 ~ 39권 1호

KCI등재

분쟁해결연구
17권 3호 ~ 17권 3호

KCI등재

독서연구
53권 0호 ~ 53권 0호

KCI등재

인문사회 21
10권 5호 ~ 10권 5호

KCI후보

다문화와 디아스포라연구
15권 0호 ~ 15권 0호

수시연구보고서
2019권 10호 ~ 2019권 9호

사업보고서
2019권 0호 ~ 2019권 0호

기초연구보고서
2019권 0호 ~ 2019권 0호

기본연구보고서
2019권 0호 ~ 2019권 0호

KCI등재

세계지역연구논총
37권 3호 ~ 37권 3호

융합과 통섭
2권 2호 ~ 2권 2호

KCI등재

환경정책
27권 3호 ~ 27권 3호

환경포럼
234권 0호 ~ 235권 0호
발행기관 최신논문
자료제공: 네이버학술정보
발행기관 최신논문
자료제공: 네이버학술정보

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기