의사 레이블링을 통한 레이블이 없는 데이터 보완 연구

유민희; 유헌창

한국정보처리학회 한국정보처리학회 학술대회논문집 의사 레이블링을 통한 레이블이 없는 데이터 보완 연구

의사 레이블링을 통한 레이블이 없는 데이터 보완 연구

Research on supplementing unlabeled data through pseudolabeling

유민희 ( Min-hee Yoo ) , 유헌창 ( Heon-chang Yu )

한국정보처리학회 2023.11

한국정보처리학회 학술대회논문집 30권 2호 410-413(4pages)

UCI I410-ECN-151-24-02-089051145

인용하기 URL 복사 보관함 담기

이 자료는 4페이지 이하의 자료입니다.

초록

레이블링 작업은 데이터 분석 시 필요한 사전 작업중 하나이다. 모든 데이터들에 대해 레이블링 작업은 시간/인적 자원을 필요로 하기에, 해당 작업을 보완할 방법이 존재한다면 요구되는 리소스를 줄여 효율성을 크게 향상시킬 수 있다. 본 논문에서는 통신회사에서 적재된 데이터 셋에 대하여 레이블이 없는 데이터(Unlabeled-data)에 대해 의사 레이블링(Pseudo-labeling), SMOTE 를 통한 데이터 증강을 활용하여 기존에 활용되지 못한 데이터를 추가하여 모델에 학습시킨다. 실험을 통해 의사 레이블을 통한 모델 학습 방법이 기존 도메인 지식의 레이블 방법보다 효율적이고 성능이 우수함을 확인하였다.

키워드

참고문헌 (0)

[자료제공 : 네이버학술정보]