닫기
216.73.216.142
216.73.216.142
close menu
악성 댓글에 사용된 문자의 형태를 고려한 한국어 자연어처리를 위한 전처리 기법
Preprocessing technique for natural language processing considering the form of characters used in malicious comments
김해수 ( Hae-soo Kim ) , 김미희 ( Mi-hui Kim )
UCI I410-ECN-0102-2023-500-000680232
이 자료는 4페이지 이하의 자료입니다.

최근 악플에 대한 논란이 끊이지 않고 있어 이것을 해결하기위한 방법으로 자연어 처리를 이용하고 있다. 특히 소셜 미디어, 온라인 커뮤니티에서 많이 발생하고 있고 해당 매체에서는 한글을 그대로 사용하지 않고 그들의 은어를 섞어서 사용하며 그중에서 한글이 아닌 문자를 섞어서 만들어낸 문장도 있다. 이러한 문장은 기존의 모델에 학습된 데이터의 형태와 다르며 한글이 아닌 문장이 많을수록 모델의 예측이 부정확해진다는 단점이 있어 본 논문에서는 인공지능을 이용한 이미지 분류와 띄어쓰기, 오타 교정을 이용한 전처리 기법을 제안한다.

[자료제공 : 네이버학술정보]
×