악성 댓글에 사용된 문자의 형태를 고려한 한국어 자연어처리를 위한 전처리 기법

김해수; 김미희

한국정보처리학회 한국정보처리학회 학술대회논문집 악성 댓글에 사용된 문자의 형태를 고려한 한국어 자연어처리를 위한 전처리 기법

악성 댓글에 사용된 문자의 형태를 고려한 한국어 자연어처리를 위한 전처리 기법

Preprocessing technique for natural language processing considering the form of characters used in malicious comments

김해수 ( Hae-soo Kim ) , 김미희 ( Mi-hui Kim )

한국정보처리학회 2022.05

한국정보처리학회 학술대회논문집 29권 1호 543-545(3pages)

UCI I410-ECN-0102-2023-500-000680232

인용하기 URL 복사 보관함 담기

이 자료는 4페이지 이하의 자료입니다.

초록

최근 악플에 대한 논란이 끊이지 않고 있어 이것을 해결하기위한 방법으로 자연어 처리를 이용하고 있다. 특히 소셜 미디어, 온라인 커뮤니티에서 많이 발생하고 있고 해당 매체에서는 한글을 그대로 사용하지 않고 그들의 은어를 섞어서 사용하며 그중에서 한글이 아닌 문자를 섞어서 만들어낸 문장도 있다. 이러한 문장은 기존의 모델에 학습된 데이터의 형태와 다르며 한글이 아닌 문장이 많을수록 모델의 예측이 부정확해진다는 단점이 있어 본 논문에서는 인공지능을 이용한 이미지 분류와 띄어쓰기, 오타 교정을 이용한 전처리 기법을 제안한다.

키워드

참고문헌 (0)

[자료제공 : 네이버학술정보]