논문 상세보기

한국정보처리학회> 정보처리학회논문지. 소프트웨어 및 데이터 공학> 영상 데이터 특징 커버리지 기반 딥러닝 모델 검증 기법

KCI등재

영상 데이터 특징 커버리지 기반 딥러닝 모델 검증 기법

Deep Learning Model Validation Method Based on Image Data Feature Coverage

임창남 ( Chang-nam Lim ) , 박예슬 ( Ye-seul Park ) , 이정원 ( Jung-won Lee )
  • : 한국정보처리학회
  • : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권9호
  • : 연속간행물
  • : 2021년 09월
  • : 375-384(10pages)
정보처리학회논문지. 소프트웨어 및 데이터 공학

DOI


목차

1. 서 론
2. 관련 연구
3. 특징 커버리지 기반 학습 모델 검증 기법
4. 특징 커버리지 기반 모델 학습 성능 분석
5. 결 론
References

키워드 보기


초록 보기

딥러닝 기법은 영상 처리 분야에서 높은 성능을 입증 받아 다양한 분야에서 적용되고 있다. 이러한 딥러닝 모델의 검증에 가장 널리 사용되는 방법으로는 홀드아웃 검증 방법, k-겹 교차 검증 방법, 부트스트랩 방법 등이 있다. 이러한 기존의 기법들은 데이터 셋을 분할하는 과정에서 클래스 간의 비율에 대한 균형을 고려하지만, 같은 클래스 내에서도 존재하는 다양한 특징들의 비율은 고려하지 않고 있다. 이러한 특징들을 고려하지 않을 경우, 일부 특징에 편향된 검증 결과를 얻게 될 수 있다. 따라서 본 논문에서는 기존 검증 방법들을 개선하여 영상 분류를 위한 데이터 특징 커버리지 기반의 딥러닝 모델 검증 기법을 제안한다. 제안하는 기법은 딥러닝 모델의 학습과 검증을 위한 훈련 데이터 셋과 평가 데이터 셋이 전체 데이터 셋의 특징을 얼마나 반영하고 있는지 수치로 측정할 수 있는 데이터 특징 커버리지를 제안한다. 이러한 방식은 전체 데이터 셋의특징을 모두 포함하도록 커버리지를 보장하여 데이터 셋을 분할할 수 있고, 모델의 평가 결과를 생성한 특징 군집 단위로 분석할 수 있다. 검증 결과, 훈련 데이터 셋의 데이터 특징 커버리지가 낮아질 경우, 모델이 특정 특징에 편향되게 학습하여 모델의 성능이 낮아지며, Fashion-MNIST의 경우 정확도가 8.9%까지 차이나는 것을 확인하였다.
Deep learning techniques have been proven to have high performance in image processing and are applied in various fields. The most widely used methods for validating a deep learning model include a holdout verification method, a k-fold cross verification method, and a bootstrap method. These legacy methods consider the balance of the ratio between classes in the process of dividing the data set, but do not consider the ratio of various features that exist within the same class. If these features are not considered, verification results may be biased toward some features. Therefore, we propose a deep learning model validation method based on data feature coverage for image classification by improving the legacy methods. The proposed technique proposes a data feature coverage that can be measured numerically how much the training data set for training and validation of the deep learning model and the evaluation data set reflects the features of the entire data set. In this method, the data set can be divided by ensuring coverage to include all features of the entire data set, and the evaluation result of the model can be analyzed in units of feature clusters. As a result, by providing feature cluster information for the evaluation result of the trained model, feature information of data that affects the trained model can be provided.

UCI(KEPA)

간행물정보

  • : 공학분야  > 전자공학
  • : KCI등재
  • :
  • : 월간
  • : 2287-5905
  • : 2734-0503
  • : 학술지
  • : 연속간행물
  • : 2012-2021
  • : 650


저작권 안내

한국학술정보㈜의 모든 학술 자료는 각 학회 및 기관과 저작권 계약을 통해 제공하고 있습니다.

이에 본 자료를 상업적 이용, 무단 배포 등 불법적으로 이용할 시에는 저작권법 및 관계법령에 따른 책임을 질 수 있습니다.

10권10호(2021년 10월) 수록논문
최근 권호 논문
| | | |

KCI등재

1(sLa-pRc)타입의 가장 빠른 경로 탐색과 결함 검사

저자 : 김순호 ( Kim Soon Ho ) , 이은서 ( Lee Eun Ser ) , 김치수 ( Kim Chi Su )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 10호 발행 연도 : 2021 페이지 : pp. 385-390 (6 pages)

다운로드

(기관인증 필요)

초록보기

갠트리는 미소 칩을 피더에서 기판까지 이동하는 장비이다. 갠트리가 부품을 이동하는 중에 카메라는 부품의 상태를 검사한다. 본 논문의 목적은 갠트리의 이동시간이 가장 짧은 경로를 찾고 그 경로에 따른 이동시간을 계산한다. 현재 사용되고 있는 부품의 상태를 검사하는 방법은 stop_motion 방식이다. 본 논문은 moving_motion 방식과 카메라 앞에서 최대속도를 갖는 fly_motion 방식을 제시한다. 또한, 부품 상태의 검사는 시그니처 방법을 사용하였다. 3가지 방식의 갠트리가 이동하는 시간을 비교했을 때, stop_motion보다 moving_motion 방식은 9.42%, fly_motion 방식은 17.73% 향상되었다. 본 논문에서 제시한 fly_motion 방식을 갠트리 이동 경로에 사용할 경우 생산성이 향상될 것으로 생각한다.


The gantry is a device that moves fine chips from the feeder to the PCB. While the gantry is moving the part, the camera checks the condition of the part. The purpose of this paper is to find the path with the shortest travel time of the gantry and calculate the travel time according to the path. stop_motion is a way to check the status of the parts currently in use. This paper presents the moving_motion method and the fly_motion method with maximum speed in front of the camera. In addition the signature method was used to inspect the condition of the parts. When comparing the moving time of the three types of gantry, the moving_motion method improved by 9.42% and the fly_motion method by 17.73% compared to stop_motion. When the fly_motion method proposed in this paper is used for the gantry movement path, it is expected that productivity will be improved.

KCI등재

2순환 심층 신경망 모델을 이용한 전용회선 트래픽 예측

저자 : 이인규 ( In-gyu Lee ) , 송미화 ( Mi-hwa Song )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 10호 발행 연도 : 2021 페이지 : pp. 391-398 (8 pages)

다운로드

(기관인증 필요)

초록보기

전용회선은 데이터 전송에 있어서 연결된 두 지역을 독점적으로 사용하는 구조이기 때문에 안정된 품질수준과 보안성이 확보되어 교환회선의 급격한 증가에도 불구하고 기업 내부에서는 지속적으로 많이 사용하는 회선 방식이다. 하지만 비용이 상대적으로 고가이기 때문에 기업 내 네트워크 운영자의 중요한 역할 중의 하나는 네트워크 전용회선의 자원을 적절히 배치하고 활용하여 최적의 상태를 유지하는 것이 중요한 요소이다. 즉, 비즈니스 서비스 요구 사항을 적절히 지원하기 위해서는 데이터 전송 관점에서 전용회선의 대역폭 자원에 대한 적절한 관리가 필수적이며 전용회선 사용량을 적절히 예측하고 관리하는 것이 핵심 요소가 된다. 이에 본 연구에서는 기업 네트워크에서 사용하는 전용회선의 실제 사용률 데이터를 기반으로 다양한 예측 모형을 적용하고 성능을 평가하였다. 일반적으로 통계적인 방법으로 많이 사용하는 평활화 기법 및 ARIMA 모형과 요즘 많은 연구가 되고 있는 인공신경망에 기반한 딥러닝의 대표적인 모형들을 적용하여 각각의 예측에 대한 성능을 측정하고 비교하였다. 또한, 실험 결과에 기초하여 전용회선 자원의 효과적인 운영 관점에서 각 모형이 예측에 대하여 좋은 성능을 내기 위하여 고려해야 할 사항을 제안하였다.


Since the leased line is a structure that exclusively uses two connected areas for data transmission, a stable quality level and security are ensured, and despite the rapid increase in the number of switched lines, it is a line method that is continuously used a lot in companies. However, because the cost is relatively high, one of the important roles of the network operator in the enterprise is to maintain the optimal state by properly arranging and utilizing the resources of the network leased line. In other words, in order to properly support business service requirements, it is essential to properly manage bandwidth resources of leased lines from the viewpoint of data transmission, and properly predicting and managing leased line usage becomes a key factor. Therefore, in this study, various prediction models were applied and performance was evaluated based on the actual usage rate data of leased lines used in corporate networks. In general, the performance of each prediction was measured and compared by applying the smoothing model and ARIMA model, which are widely used as statistical methods, and the representative models of deep learning based on artificial neural networks, which are being studied a lot these days. In addition, based on the experimental results, we proposed the items to be considered in order for each model to achieve good performance for prediction from the viewpoint of effective operation of leased line resources.

KCI등재

3그래프 기반 음악 추천을 위한 소리 데이터를 통한 태그 자동 분류

저자 : 김태진 ( Taejin Kim ) , 김희찬 ( Heechan Kim ) , 이수원 ( Soowon Lee )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 10호 발행 연도 : 2021 페이지 : pp. 399-406 (8 pages)

다운로드

(기관인증 필요)

초록보기

콘텐츠 산업의 꾸준한 성장에 따라 수많은 콘텐츠 중에서 개인의 취향에 적합한 콘텐츠를 자동으로 추천하는 연구의 필요성이 증가하고 있다. 콘텐츠 자동 추천의 정확도를 향상시키기 위해서는 콘텐츠에 대한 사용자의 선호 이력을 바탕으로 하는 기존 추천 기법과 더불어 콘텐츠의 메타 데이터 및 콘텐츠 자체에서 추출할 수 있는 특징을 융합한 추천 기법이 필요하다. 본 연구에서는 음악의 소리 데이터로부터 태그 정보를 분류하는 LSTM 기반의 모델을 학습하고 분류된 태그 정보를 음악의 메타 데이터로 추가하여, 그래프 임베딩 시 콘텐츠의 특징까지 고려할 수 있는 KPRN 기반의 새로운 콘텐츠 추천 방법을 제안한다. 카카오 아레나 데이터 기반 실험 결과, 본 연구의 제안 방법은 기존의 임베딩 기반 추천 방법보다 우수한 추천 정확도를 보였다.


With the steady growth of the content industry, the need for research that automatically recommending content suitable for individual tastes is increasing. In order to improve the accuracy of automatic content recommendation, it is needed to fuse existing recommendation techniques using users' preference history for contents along with recommendation techniques using content metadata or features extracted from the content itself. In this work, we propose a new graph-based music recommendation method which learns an LSTM-based classification model to automatically extract appropriate tagging words from sound data and apply the extracted tagging words together with the users' preferred music lists and music metadata to graph-based music recommendation. Experimental results show that the proposed method outperforms existing recommendation methods in terms of the recommendation accuracy.

KCI등재

4파라메트릭 활성함수를 이용한 기울기 소실 문제의 완화

저자 : 고영민 ( Young Min Ko ) , 고선우 ( Sun Woo Ko )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 10호 발행 연도 : 2021 페이지 : pp. 407-420 (14 pages)

다운로드

(기관인증 필요)

초록보기

심층신경망은 다양한 문제를 해결하는데 널리 사용되고 있다. 하지만 은닉층이 깊은 심층신경망을 학습하는 동안 빈번히 발생하는 기울기 소실 또는 폭주 문제는 심층신경망 학습의 큰 걸림돌이 되고 있다. 본 연구에서는 기울기 소실이 발생하는 원인 중 비선형활성함수에 의해 발생할 수 있는 기울기 소실 문제를 완화하기 위해 파라메트릭 활성함수를 제안한다. 제안된 파라메트릭 활성함수는 입력 데이터의 특성에 따라 활성함수의 크기 및 위치를 변환시킬 수 있는 파라미터를 적용하여 얻을 수 있으며 역전파과정을 통해 활성함수의 미분 크기에 제한이 없는 손실함수를 최소화되도록 학습시킬 수 있다. 은닉층 수가 10개인 XOR문제와 은닉층 수가 8개인 MNIST 분류문제를 통하여 기존 비선형활성함수와 파라메트릭활성함수의 성능을 비교하였고 제안한 파라메트릭 활성함수가 기울기 소실 완화에 우월한 성능을 가짐을 확인하였다.


Deep neural networks are widely used to solve various problems. However, the deep neural network with a deep hidden layer frequently has a vanishing gradient or exploding gradient problem, which is a major obstacle to learning the deep neural network. In this paper, we propose a parametric activation function to alleviate the vanishing gradient problem that can be caused by nonlinear activation function. The proposed parametric activation function can be obtained by applying a parameter that can convert the scale and location of the activation function according to the characteristics of the input data, and the loss function can be minimized without limiting the derivative of the activation function through the backpropagation process. Through the XOR problem with 10 hidden layers and the MNIST classification problem with 8 hidden layers, the performance of the original nonlinear and parametric activation functions was compared, and it was confirmed that the proposed parametric activation function has superior performance in alleviating the vanishing gradient.

KCI등재

5스마트폰에서 촬영된 HEIF 파일 특징 분석에 관한 연구

저자 : 권영진 ( Youngjin Kwon ) , 방수민 ( Sumin Bang ) , 한재혁 ( Jaehyeok Han ) , 이상진 ( Sangjin Lee )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 10호 발행 연도 : 2021 페이지 : pp. 421-428 (8 pages)

다운로드

(기관인증 필요)

초록보기

HEIF(High Efficiency Image File Format)는 MPEG에서 개발된 이미지 포맷으로써, 비디오 코덱인 H.265를 활용하여 정지된 화면을 하나의 이미지 형태로 저장할 수 있도록 개발된 컨테이너이다. 아이폰은 2017년부터 HEIF를 사용하고 있으며, 2019년부터는 갤럭시 S10과 같은 안드로이드 기기도 해당 포맷을 지원하고 있다. 이 포맷은 우수한 압축률을 가지도록 이미지를 제공할 수 있으나, 복잡한 내부 구조를 가지고 있어 기기나 소프트웨어 간 호환성이 현저하게 부족하여 일반적으로 사용되는 JPEG(또는 JPG) 파일을 대체하기에는 아직 대중적이지 못한 상황이다. 하지만 이미 많은 기기에서 HEIF를 사용하고 있음에도 불구하고 디지털 포렌식 연구는 부족한 상황이다. 이는 디지털 포렌식 조사 과정에서 파일 내부에 포함된 정보의 파악이 미흡하여 잠재적인 증거를 놓칠 수 있는 위험에 노출될 수 있다. 따라서 본 논문에서는 아이폰에서 촬영된 HEIF 형식의 사진 파일과 갤럭시에서 촬영된 모션 포토 파일을 분석하여 파일 내부에 포함된 정보와 특징들을 알아본다. 또한 이미지 뷰어 기능을 지원하는 소프트웨어를 대상으로 HEIF에 대한 지원 여부를 조사하고 HEIF를 분석하는 포렌식 도구의 요구사항을 제시한다.


The High Efficiency Image File Format (HEIF) is an MPEG-developed image format that utilizes the video codec H.265 to store still screens in a single image format. The iPhone has been using HEIF since 2017, and Android devices such as the Galaxy S10 have also supported the format since 2019. The format can provide images with good compression rates, but it has a complex internal structure and lacks significant compatibility between devices and software, making it not popular to replace commonly used JPEG (or JPG) files. However, despite the fact that many devices are already using HEIF, digital forensics research regarding it is lacking. This means that we can be exposed to the risk of missing potential evidence due to insufficient understanding of the information contained inside the file during digital forensics investigations. Therefore, in this paper, we analyze the HEIF formatted photo file taken on the iPhone and the motion photo file taken on the Galaxy to find out the information and features contained inside the file. We also investigate whether or not the software we tested support HEIF and present the requirement of forensic tools to analyze HEIF.

KCI등재

6상호작용 기반의 홀로그램 실감 콘텐츠 서비스연구

저자 : 이완중 ( Lee Wan Jung ) , 신은지 ( Shin Eun Ji ) , 윤현선 ( Yoon Hyun Sun ) , 최희민 ( Choi Hee Min ) , 조동식 ( Cho Dong Sik ) , 강훈종 ( Kang Hoon Jong )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 10호 발행 연도 : 2021 페이지 : pp. 429-438 (10 pages)

다운로드

(기관인증 필요)

초록보기

최근 실감 콘텐츠는 디스플레이 기술의 발달에 따라 다양한 방식으로 적용되고 있으며 높아지는 대중의 요구에 따라 최종적 실감 콘텐츠 기술인 홀로그램이 제한적으로 사용되고 있다. 그러나 대부분의 실감 콘텐츠에는 HMD(head mounted device) 또는 안경 형태의 디바이스가 요구되며 기타의 실감 콘텐츠 디스플레이 기술은 체험 공간에서의 단일 이미지 평면을 사용자에게 전달하므로 단조로운 콘텐츠 체험을 제공한다. 이에 본 논문에서는 다양한 실감 콘텐츠 기술과 홀로그램 기술이 적용된 실감 콘텐츠를 정리하고, 프로젝션 맵핑과 플로팅 홀로그램을 융합한 상호작용 기반의 체험형 실감 콘텐츠 서비스를 제안한다. 프로젝션 맵핑되는 스크린과 다중 플로팅 홀로그램 생성 장치를 통해 사용자 시점에서의 깊이 방향이 확장된 3차원 입체 공간을 제공함과 동시에 사용자의 신체 전체와 부분적 모션을 다수의 센서를 통해 인식가능하게 하여 기존 대비 사용자의 활동 영역이 확장된 상호작용 콘텐츠 서비스가 실현이 가능하도록 설계하였다.


In recent, realistic content has been applied in various ways due to the development of display technology and hologram, the final realistic content technology, have been used limitedly in accordance with the growing public demand. However, most realistic content requires additional devices of HMD (head mounted device) or glasses type, and other realistic content display technologies deliver a single image plane in the experience space to the user, providing a monotonous content experience. Various realistic contents with hologram technology are introduced in this work. In addition, we propose an interaction based realistic hologram service based that combines projection mapping and floating holograms. Projection-mapped screens and multi-floating hologram device provide a three-dimensional volumetric space with extended depth orientation from the user's point of view, while allowing users' entire and partial motions to be recognizable through multiple sensors.

1
권호별 보기
같은 권호 다른 논문
| | | | 다운로드

KCI등재

1향상된 교차 버전 결함 예측을 위한 베이지안 최적화 프레임워크

저자 : 최정환 ( Jeongwhan Choi ) , 류덕산 ( Duksan Ryu )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 9호 발행 연도 : 2021 페이지 : pp. 339-348 (10 pages)

다운로드

(기관인증 필요)

초록보기

최근 소프트웨어 결함 예측 연구는 교차 프로젝트 간의 결함 예측뿐만 아니라 교차 버전 프로젝트 간의 결함 예측 또한 이루어지고 있다. 종래의 교차 버전 결함 예측 연구들은 WP(Within-Project)로 가정한다. 하지만, CV(Cross-Version) 환경에서는 프로젝트 버전 간의 분포 차이의 중요성을 고려한 연구들이 없다. 본 연구에서는 다른 버전 간의 분포 차이까지 고려하는 자동화된 베이지안 최적화 프레임워크를 제안한다. 이를 통해 분포차이에 따라 전이 학습(Transfer Learning) 수행 여부를 자동으로 선택하여 준다. 해당 프레임워크는 버전 간의 분포 차이, 전이 학습과 분류기(Classifier)의 하이퍼파라미터를 최적화하는 기법이다. 실험을 통해 전이 학습 수행 여부를 분포차 기준으로 자동으로 선택하는 방법이 효과적이라는 것을 알 수 있다. 그리고 최적화를 이용하는 것이 성능 향상에 효과가 있으며 이러한 결과 소프트웨어 인스펙션 노력을 감소할 수 있다는 것을 확인할 수 있다. 이를 통해 교차 버전 프로젝트 환경에서 신규 버전 프로젝트에 대하여 효과적인 품질 보증 활동 수행을 지원할 것으로 기대된다.

KCI등재

2CAM과 Selective Search를 이용한 확장된 객체 지역화 학습데이터 생성 및 이의 재학습을 통한 WSOL 성능 개선

저자 : 고수연 ( Sooyeon Go ) , 최영우 ( Yeongwoo Choi )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 9호 발행 연도 : 2021 페이지 : pp. 349-358 (10 pages)

다운로드

(기관인증 필요)

초록보기

최근 CAM[1]을 이용해서 이미지의 객체에 대한 주의 영역 또는 지역화(Localization) 영역을 찾는 방법이 WSOL의 연구로서 다양하게 수행되고 있다. CAM을 이용한 객체의 히트(Heat) 맵에서 주의 영역 추출은 객체의 특징이 가장 많이 모여 있는 영역만을 주로 집중해서 객체의 전체적인 영역을 찾지 못하는 단점이 있다. 여기서는 이를 개선하기 위해서 먼저 CAM과 Selective Search[6]를 함께 이용하여 CAM 히트맵의 주의 영역을 확장하고, 확장된 영역에 가우시안 스무딩을 적용하여 재학습 데이터를 만든 후, 이를 학습하여 객체의 주의 영역이 확장되는 방법을 제안한다. 제안 방법은 단 한 번의 재학습만이 필요하며, 학습 후 지역화를 수행할 때는 Selective Search를 실행하지 않기 때문에 처리 시간이 대폭 줄어든다. 실험에서 기존 CAM의 히트맵들과 비교했을 때 핵심 특징 영역으로부터 주의 영역이 확장되고, 확장된 주의 영역 바운딩 박스에 대한 Ground Truth와의 IOU 계산에서 기존 CAM보다 약 58%가 개선되었다.

KCI등재

3아파트 하자 보수 시설공사 세부공종 머신러닝 분류 시스템에 관한 연구

저자 : 김은혜 ( Eunhye Kim ) , 지홍근 ( HongGeun Ji ) , 김지나 ( Jina Kim ) , 박은일 ( Eunil Park ) , 엄재용 ( Jay Y. Ohm )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 9호 발행 연도 : 2021 페이지 : pp. 359-366 (8 pages)

다운로드

(기관인증 필요)

초록보기

대한민국 건설사들은 아파트 하자 정보를 축적하고 보수작업을 관리하기 위한 시스템을 운영하는데 상당한 인력과 비용을 투자하고 있다. 본 연구에서는 하자 접수 상세내용 텍스트 데이터를 이용하여 하자 보수 시설공사에 따른 세부공종을 분류하는 머신러닝 모델을 제안한다. 두 가지 단어 임베딩(Bag-of-words, Term Frequency-Inverse Document Frequency (TF-IDF))과 두 가지 분류기(Support Vector Machine, Random Forest)를 통해 한국어로 작성된 65만건 이상의 하자 접수데이터로부터 하자보수 시설공사 세부공종을 분류했다. 특히, 이번 연구에서는 특정 시설공사(마감공사)의 9개 세부공종(가전제품, 도배공사, 도장공사, 미장공사, 석공사, 수장공사, 옥내가구공사, 주방기구공사, 타일공사)을 분류하는 이진 분류 모델과 다중 분류 모델을 연구했다. 그 결과, TF-IDF와 Random Forest를 사용한 두가지 분류 모델에서 90%이상의 정확도, 정밀도, 재현율 및 F1점수를 확인했다.

KCI등재

4해외지수와 투자자별 매매 동향에 따른 딥러닝 기반 주가 등락 예측

저자 : 김태승 ( Tae Seung Kim ) , 이수원 ( Soowon Lee )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 9호 발행 연도 : 2021 페이지 : pp. 367-374 (8 pages)

다운로드

(기관인증 필요)

초록보기

주가 예측은 경제, 통계, 컴퓨터 공학 등 여러 분야에서 연구되는 주제이며, 특히 최근에는 기본적 지표나 기술적 지표 등 다양한 지표로부터 인공지능 모델을 학습하여 주가의 변동을 예측하는 연구들이 활발해 지고 있다. 본 연구에서는 S&P500 등의 해외지수, 과거 KOSPI 지수, 그리고 KOSPI 투자자별 매매 동향으로부터 KOSPI의 등락을 예측하는 딥러닝 모델을 제안한다. 제안 모델은 주가 등락 예측을 위하여 비지도 학습 방법인 적층 오토인코더를 이용하여 잠재변수를 추출하고, 추출된 잠재변수로부터 시계열 데이터 학습에 적합한 LSTM 모델로 학습하여 당일 시가 대비 종가의 등락을 예측하며, 예측된 값을 기반으로 매수 또는 매도를 결정한다. 본 연구에서 제안하는 모델과 비교 모델들의 수익률 및 예측 정확도를 비교한 결과 제안 모델이 비교 모델들 보다 우수한 성능을 보였다.

KCI등재

5영상 데이터 특징 커버리지 기반 딥러닝 모델 검증 기법

저자 : 임창남 ( Chang-nam Lim ) , 박예슬 ( Ye-seul Park ) , 이정원 ( Jung-won Lee )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 9호 발행 연도 : 2021 페이지 : pp. 375-384 (10 pages)

다운로드

(기관인증 필요)

초록보기

딥러닝 기법은 영상 처리 분야에서 높은 성능을 입증 받아 다양한 분야에서 적용되고 있다. 이러한 딥러닝 모델의 검증에 가장 널리 사용되는 방법으로는 홀드아웃 검증 방법, k-겹 교차 검증 방법, 부트스트랩 방법 등이 있다. 이러한 기존의 기법들은 데이터 셋을 분할하는 과정에서 클래스 간의 비율에 대한 균형을 고려하지만, 같은 클래스 내에서도 존재하는 다양한 특징들의 비율은 고려하지 않고 있다. 이러한 특징들을 고려하지 않을 경우, 일부 특징에 편향된 검증 결과를 얻게 될 수 있다. 따라서 본 논문에서는 기존 검증 방법들을 개선하여 영상 분류를 위한 데이터 특징 커버리지 기반의 딥러닝 모델 검증 기법을 제안한다. 제안하는 기법은 딥러닝 모델의 학습과 검증을 위한 훈련 데이터 셋과 평가 데이터 셋이 전체 데이터 셋의 특징을 얼마나 반영하고 있는지 수치로 측정할 수 있는 데이터 특징 커버리지를 제안한다. 이러한 방식은 전체 데이터 셋의특징을 모두 포함하도록 커버리지를 보장하여 데이터 셋을 분할할 수 있고, 모델의 평가 결과를 생성한 특징 군집 단위로 분석할 수 있다. 검증 결과, 훈련 데이터 셋의 데이터 특징 커버리지가 낮아질 경우, 모델이 특정 특징에 편향되게 학습하여 모델의 성능이 낮아지며, Fashion-MNIST의 경우 정확도가 8.9%까지 차이나는 것을 확인하였다.

1
발행기관 최신논문
자료제공: 네이버학술정보
발행기관 최신논문
자료제공: 네이버학술정보

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기