논문 상세보기

한국정보처리학회> 정보처리학회논문지. 소프트웨어 및 데이터 공학> 가중치 손실 함수를 가지는 순환 컨볼루션 신경망 기반 주가 예측

KCI등재

가중치 손실 함수를 가지는 순환 컨볼루션 신경망 기반 주가 예측

A Stock Price Prediction Based on Recurrent Convolution Neural Network with Weighted Loss Function

김현진 ( Hyunjin Kim ) , 정연승 ( Yeon Sung Jung )
  • : 한국정보처리학회
  • : 정보처리학회논문지. 소프트웨어 및 데이터 공학 8권3호
  • : 연속간행물
  • : 2019년 03월
  • : 123-128(6pages)
정보처리학회논문지. 소프트웨어 및 데이터 공학

DOI


목차

1. 서 론
2. 배경 지식
3. RCNN 기반의 제안된 신경망
4. 실험 결과 및 분석
5. 결 론
References

키워드 보기


초록 보기

본 논문에서는 RCNN (recurrent convolution neural network) 계층 모델을 채택한 인공 지능에 기반을 둔 주가 예측을 제안한다. LSTM(long-term memory model) 기반 신경망은 시계열 데이터의 예측에 사용된다. 다른 한편, 컨볼루션 신경망은 데이터 필터링, 평균화 및 데이터확장을 제공한다. 제안된 주가 예측에서는 위에서 언급 한 장점들을 RCNN 모델에서 결합하여 적용함으로써 다음날의 주가 종가를 예측한다. 그리고 최근의 시계열의 데이터를 강조하기 위해 커스텀 가중치 손실 함수가 채택되었다. 또한 시장의 상황을 반영하기 위해 주가 인덱스에 관련된 데이터를 입력으로 포함하였다. 제안된 주가 예측 방식은 실제 주가를 대상으로 한 실험에서 3.19%로 테스트 오차를 줄였으며, 다른 방법보다 약 19%의 성능 향상을 거둘 수 있었다.
This paper proposes the stock price prediction based on the artificial intelligence, where the model with recurrent convolution neural network (RCNN) layers is adopted. In the motivation of this prediction, long short-term memory model (LSTM)-based neural network can make the output of the time series prediction. On the other hand, the convolution neural network provides the data filtering, averaging, and augmentation. By combining the advantages mentioned above, the proposed technique predicts the estimated stock price of next day. In addition, in order to emphasize the recent time series, a custom weighted loss function is adopted. Moreover, stock data related to the stock price index are adopted to consider the market trends. In the experiments, the proposed stock price prediction reduces the test error by 3.19%, which is over other techniques by about 19%.

UCI(KEPA)

I410-ECN-0102-2019-500-001456542

간행물정보

  • : 공학분야  > 전자공학
  • : KCI등재
  • :
  • : 월간
  • : 2287-5905
  • : 2734-0503
  • : 학술지
  • : 연속간행물
  • : 2012-2021
  • : 650


저작권 안내

한국학술정보㈜의 모든 학술 자료는 각 학회 및 기관과 저작권 계약을 통해 제공하고 있습니다.

이에 본 자료를 상업적 이용, 무단 배포 등 불법적으로 이용할 시에는 저작권법 및 관계법령에 따른 책임을 질 수 있습니다.

10권10호(2021년 10월) 수록논문
최근 권호 논문
| | | |

KCI등재

1(sLa-pRc)타입의 가장 빠른 경로 탐색과 결함 검사

저자 : 김순호 ( Kim Soon Ho ) , 이은서 ( Lee Eun Ser ) , 김치수 ( Kim Chi Su )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 10호 발행 연도 : 2021 페이지 : pp. 385-390 (6 pages)

다운로드

(기관인증 필요)

초록보기

갠트리는 미소 칩을 피더에서 기판까지 이동하는 장비이다. 갠트리가 부품을 이동하는 중에 카메라는 부품의 상태를 검사한다. 본 논문의 목적은 갠트리의 이동시간이 가장 짧은 경로를 찾고 그 경로에 따른 이동시간을 계산한다. 현재 사용되고 있는 부품의 상태를 검사하는 방법은 stop_motion 방식이다. 본 논문은 moving_motion 방식과 카메라 앞에서 최대속도를 갖는 fly_motion 방식을 제시한다. 또한, 부품 상태의 검사는 시그니처 방법을 사용하였다. 3가지 방식의 갠트리가 이동하는 시간을 비교했을 때, stop_motion보다 moving_motion 방식은 9.42%, fly_motion 방식은 17.73% 향상되었다. 본 논문에서 제시한 fly_motion 방식을 갠트리 이동 경로에 사용할 경우 생산성이 향상될 것으로 생각한다.


The gantry is a device that moves fine chips from the feeder to the PCB. While the gantry is moving the part, the camera checks the condition of the part. The purpose of this paper is to find the path with the shortest travel time of the gantry and calculate the travel time according to the path. stop_motion is a way to check the status of the parts currently in use. This paper presents the moving_motion method and the fly_motion method with maximum speed in front of the camera. In addition the signature method was used to inspect the condition of the parts. When comparing the moving time of the three types of gantry, the moving_motion method improved by 9.42% and the fly_motion method by 17.73% compared to stop_motion. When the fly_motion method proposed in this paper is used for the gantry movement path, it is expected that productivity will be improved.

KCI등재

2순환 심층 신경망 모델을 이용한 전용회선 트래픽 예측

저자 : 이인규 ( In-gyu Lee ) , 송미화 ( Mi-hwa Song )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 10호 발행 연도 : 2021 페이지 : pp. 391-398 (8 pages)

다운로드

(기관인증 필요)

초록보기

전용회선은 데이터 전송에 있어서 연결된 두 지역을 독점적으로 사용하는 구조이기 때문에 안정된 품질수준과 보안성이 확보되어 교환회선의 급격한 증가에도 불구하고 기업 내부에서는 지속적으로 많이 사용하는 회선 방식이다. 하지만 비용이 상대적으로 고가이기 때문에 기업 내 네트워크 운영자의 중요한 역할 중의 하나는 네트워크 전용회선의 자원을 적절히 배치하고 활용하여 최적의 상태를 유지하는 것이 중요한 요소이다. 즉, 비즈니스 서비스 요구 사항을 적절히 지원하기 위해서는 데이터 전송 관점에서 전용회선의 대역폭 자원에 대한 적절한 관리가 필수적이며 전용회선 사용량을 적절히 예측하고 관리하는 것이 핵심 요소가 된다. 이에 본 연구에서는 기업 네트워크에서 사용하는 전용회선의 실제 사용률 데이터를 기반으로 다양한 예측 모형을 적용하고 성능을 평가하였다. 일반적으로 통계적인 방법으로 많이 사용하는 평활화 기법 및 ARIMA 모형과 요즘 많은 연구가 되고 있는 인공신경망에 기반한 딥러닝의 대표적인 모형들을 적용하여 각각의 예측에 대한 성능을 측정하고 비교하였다. 또한, 실험 결과에 기초하여 전용회선 자원의 효과적인 운영 관점에서 각 모형이 예측에 대하여 좋은 성능을 내기 위하여 고려해야 할 사항을 제안하였다.


Since the leased line is a structure that exclusively uses two connected areas for data transmission, a stable quality level and security are ensured, and despite the rapid increase in the number of switched lines, it is a line method that is continuously used a lot in companies. However, because the cost is relatively high, one of the important roles of the network operator in the enterprise is to maintain the optimal state by properly arranging and utilizing the resources of the network leased line. In other words, in order to properly support business service requirements, it is essential to properly manage bandwidth resources of leased lines from the viewpoint of data transmission, and properly predicting and managing leased line usage becomes a key factor. Therefore, in this study, various prediction models were applied and performance was evaluated based on the actual usage rate data of leased lines used in corporate networks. In general, the performance of each prediction was measured and compared by applying the smoothing model and ARIMA model, which are widely used as statistical methods, and the representative models of deep learning based on artificial neural networks, which are being studied a lot these days. In addition, based on the experimental results, we proposed the items to be considered in order for each model to achieve good performance for prediction from the viewpoint of effective operation of leased line resources.

KCI등재

3그래프 기반 음악 추천을 위한 소리 데이터를 통한 태그 자동 분류

저자 : 김태진 ( Taejin Kim ) , 김희찬 ( Heechan Kim ) , 이수원 ( Soowon Lee )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 10호 발행 연도 : 2021 페이지 : pp. 399-406 (8 pages)

다운로드

(기관인증 필요)

초록보기

콘텐츠 산업의 꾸준한 성장에 따라 수많은 콘텐츠 중에서 개인의 취향에 적합한 콘텐츠를 자동으로 추천하는 연구의 필요성이 증가하고 있다. 콘텐츠 자동 추천의 정확도를 향상시키기 위해서는 콘텐츠에 대한 사용자의 선호 이력을 바탕으로 하는 기존 추천 기법과 더불어 콘텐츠의 메타 데이터 및 콘텐츠 자체에서 추출할 수 있는 특징을 융합한 추천 기법이 필요하다. 본 연구에서는 음악의 소리 데이터로부터 태그 정보를 분류하는 LSTM 기반의 모델을 학습하고 분류된 태그 정보를 음악의 메타 데이터로 추가하여, 그래프 임베딩 시 콘텐츠의 특징까지 고려할 수 있는 KPRN 기반의 새로운 콘텐츠 추천 방법을 제안한다. 카카오 아레나 데이터 기반 실험 결과, 본 연구의 제안 방법은 기존의 임베딩 기반 추천 방법보다 우수한 추천 정확도를 보였다.


With the steady growth of the content industry, the need for research that automatically recommending content suitable for individual tastes is increasing. In order to improve the accuracy of automatic content recommendation, it is needed to fuse existing recommendation techniques using users' preference history for contents along with recommendation techniques using content metadata or features extracted from the content itself. In this work, we propose a new graph-based music recommendation method which learns an LSTM-based classification model to automatically extract appropriate tagging words from sound data and apply the extracted tagging words together with the users' preferred music lists and music metadata to graph-based music recommendation. Experimental results show that the proposed method outperforms existing recommendation methods in terms of the recommendation accuracy.

KCI등재

4파라메트릭 활성함수를 이용한 기울기 소실 문제의 완화

저자 : 고영민 ( Young Min Ko ) , 고선우 ( Sun Woo Ko )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 10호 발행 연도 : 2021 페이지 : pp. 407-420 (14 pages)

다운로드

(기관인증 필요)

초록보기

심층신경망은 다양한 문제를 해결하는데 널리 사용되고 있다. 하지만 은닉층이 깊은 심층신경망을 학습하는 동안 빈번히 발생하는 기울기 소실 또는 폭주 문제는 심층신경망 학습의 큰 걸림돌이 되고 있다. 본 연구에서는 기울기 소실이 발생하는 원인 중 비선형활성함수에 의해 발생할 수 있는 기울기 소실 문제를 완화하기 위해 파라메트릭 활성함수를 제안한다. 제안된 파라메트릭 활성함수는 입력 데이터의 특성에 따라 활성함수의 크기 및 위치를 변환시킬 수 있는 파라미터를 적용하여 얻을 수 있으며 역전파과정을 통해 활성함수의 미분 크기에 제한이 없는 손실함수를 최소화되도록 학습시킬 수 있다. 은닉층 수가 10개인 XOR문제와 은닉층 수가 8개인 MNIST 분류문제를 통하여 기존 비선형활성함수와 파라메트릭활성함수의 성능을 비교하였고 제안한 파라메트릭 활성함수가 기울기 소실 완화에 우월한 성능을 가짐을 확인하였다.


Deep neural networks are widely used to solve various problems. However, the deep neural network with a deep hidden layer frequently has a vanishing gradient or exploding gradient problem, which is a major obstacle to learning the deep neural network. In this paper, we propose a parametric activation function to alleviate the vanishing gradient problem that can be caused by nonlinear activation function. The proposed parametric activation function can be obtained by applying a parameter that can convert the scale and location of the activation function according to the characteristics of the input data, and the loss function can be minimized without limiting the derivative of the activation function through the backpropagation process. Through the XOR problem with 10 hidden layers and the MNIST classification problem with 8 hidden layers, the performance of the original nonlinear and parametric activation functions was compared, and it was confirmed that the proposed parametric activation function has superior performance in alleviating the vanishing gradient.

KCI등재

5스마트폰에서 촬영된 HEIF 파일 특징 분석에 관한 연구

저자 : 권영진 ( Youngjin Kwon ) , 방수민 ( Sumin Bang ) , 한재혁 ( Jaehyeok Han ) , 이상진 ( Sangjin Lee )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 10호 발행 연도 : 2021 페이지 : pp. 421-428 (8 pages)

다운로드

(기관인증 필요)

초록보기

HEIF(High Efficiency Image File Format)는 MPEG에서 개발된 이미지 포맷으로써, 비디오 코덱인 H.265를 활용하여 정지된 화면을 하나의 이미지 형태로 저장할 수 있도록 개발된 컨테이너이다. 아이폰은 2017년부터 HEIF를 사용하고 있으며, 2019년부터는 갤럭시 S10과 같은 안드로이드 기기도 해당 포맷을 지원하고 있다. 이 포맷은 우수한 압축률을 가지도록 이미지를 제공할 수 있으나, 복잡한 내부 구조를 가지고 있어 기기나 소프트웨어 간 호환성이 현저하게 부족하여 일반적으로 사용되는 JPEG(또는 JPG) 파일을 대체하기에는 아직 대중적이지 못한 상황이다. 하지만 이미 많은 기기에서 HEIF를 사용하고 있음에도 불구하고 디지털 포렌식 연구는 부족한 상황이다. 이는 디지털 포렌식 조사 과정에서 파일 내부에 포함된 정보의 파악이 미흡하여 잠재적인 증거를 놓칠 수 있는 위험에 노출될 수 있다. 따라서 본 논문에서는 아이폰에서 촬영된 HEIF 형식의 사진 파일과 갤럭시에서 촬영된 모션 포토 파일을 분석하여 파일 내부에 포함된 정보와 특징들을 알아본다. 또한 이미지 뷰어 기능을 지원하는 소프트웨어를 대상으로 HEIF에 대한 지원 여부를 조사하고 HEIF를 분석하는 포렌식 도구의 요구사항을 제시한다.


The High Efficiency Image File Format (HEIF) is an MPEG-developed image format that utilizes the video codec H.265 to store still screens in a single image format. The iPhone has been using HEIF since 2017, and Android devices such as the Galaxy S10 have also supported the format since 2019. The format can provide images with good compression rates, but it has a complex internal structure and lacks significant compatibility between devices and software, making it not popular to replace commonly used JPEG (or JPG) files. However, despite the fact that many devices are already using HEIF, digital forensics research regarding it is lacking. This means that we can be exposed to the risk of missing potential evidence due to insufficient understanding of the information contained inside the file during digital forensics investigations. Therefore, in this paper, we analyze the HEIF formatted photo file taken on the iPhone and the motion photo file taken on the Galaxy to find out the information and features contained inside the file. We also investigate whether or not the software we tested support HEIF and present the requirement of forensic tools to analyze HEIF.

KCI등재

6상호작용 기반의 홀로그램 실감 콘텐츠 서비스연구

저자 : 이완중 ( Lee Wan Jung ) , 신은지 ( Shin Eun Ji ) , 윤현선 ( Yoon Hyun Sun ) , 최희민 ( Choi Hee Min ) , 조동식 ( Cho Dong Sik ) , 강훈종 ( Kang Hoon Jong )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 10권 10호 발행 연도 : 2021 페이지 : pp. 429-438 (10 pages)

다운로드

(기관인증 필요)

초록보기

최근 실감 콘텐츠는 디스플레이 기술의 발달에 따라 다양한 방식으로 적용되고 있으며 높아지는 대중의 요구에 따라 최종적 실감 콘텐츠 기술인 홀로그램이 제한적으로 사용되고 있다. 그러나 대부분의 실감 콘텐츠에는 HMD(head mounted device) 또는 안경 형태의 디바이스가 요구되며 기타의 실감 콘텐츠 디스플레이 기술은 체험 공간에서의 단일 이미지 평면을 사용자에게 전달하므로 단조로운 콘텐츠 체험을 제공한다. 이에 본 논문에서는 다양한 실감 콘텐츠 기술과 홀로그램 기술이 적용된 실감 콘텐츠를 정리하고, 프로젝션 맵핑과 플로팅 홀로그램을 융합한 상호작용 기반의 체험형 실감 콘텐츠 서비스를 제안한다. 프로젝션 맵핑되는 스크린과 다중 플로팅 홀로그램 생성 장치를 통해 사용자 시점에서의 깊이 방향이 확장된 3차원 입체 공간을 제공함과 동시에 사용자의 신체 전체와 부분적 모션을 다수의 센서를 통해 인식가능하게 하여 기존 대비 사용자의 활동 영역이 확장된 상호작용 콘텐츠 서비스가 실현이 가능하도록 설계하였다.


In recent, realistic content has been applied in various ways due to the development of display technology and hologram, the final realistic content technology, have been used limitedly in accordance with the growing public demand. However, most realistic content requires additional devices of HMD (head mounted device) or glasses type, and other realistic content display technologies deliver a single image plane in the experience space to the user, providing a monotonous content experience. Various realistic contents with hologram technology are introduced in this work. In addition, we propose an interaction based realistic hologram service based that combines projection mapping and floating holograms. Projection-mapped screens and multi-floating hologram device provide a three-dimensional volumetric space with extended depth orientation from the user's point of view, while allowing users' entire and partial motions to be recognizable through multiple sensors.

1
권호별 보기
같은 권호 다른 논문
| | | | 다운로드

KCI등재

1마이크로서비스 아키텍처 기반의 통합 콘텐츠 관리 시스템 설계 및 구현

저자 : 윤경식 ( Kyung Sik Yoon ) , 김영한 ( Young Han Kim )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 8권 3호 발행 연도 : 2019 페이지 : pp. 97-108 (12 pages)

다운로드

(기관인증 필요)

초록보기

디지털 콘텐츠 재화가 증가됨에 따라 이를 관리하기 위한 콘텐츠 관리 시스템에 새로운 콘텐츠 서비스를 추가하거나 기존 콘텐츠 관리 시스템 간에 통합하는 경우가 빈번하게 발생한다. 효율적인 시스템 통합을 위해 본 논문에서는 이 기종으로 구성된 두개의 콘텐츠 관리 시스템을 마이크로서비스 아키텍처 기반으로 통합 콘텐츠 관리 시스템을 설계하여 개발 간 기존 시스템의 중단 없이 재활용이 가능하고, 효율적으로 통합이 가능하며, 확장성을 가진 시스템을 구현하였다. 이를 통해 구현된 시스템의 소요되는 자원 사용량을 측정하고, 기존 미들웨어를 사용한 시스템 통합을 방식 간의 차이점을 분석하였다.

KCI등재

2문장 및 어절 유사도를 이용한 표절 탐지 시스템 구현

저자 : 맹주수 ( Joosoo Maeng ) , 박지수 ( Ji Su Park ) , 손진곤 ( Jin Gon Shon )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 8권 3호 발행 연도 : 2019 페이지 : pp. 109-114 (6 pages)

다운로드

(기관인증 필요)

초록보기

기존 표절 탐지 시스템은 형태소 분석을 기반으로 공통 단어의 빈도수를 이용해 문서의 유사도를 측정한다. 그러나 주제가 같아 유사 단어가 많이 쓰인 경우, 문장 단위로 일부만 발췌 표절한 경우, 그리고 조사와 어미의 유사성이 있는 경우는 공통 단어의 빈도수만으로는 정확한 유사도를 측정하는데 한계가 있다. 따라서 본 논문에서는 공통 단어 빈도수 기반의 유사도 측정 외에 문장 유사도와 어절 유사도를 추가적으로 측정해 유사도의 정확성을 높일 수 있는 표절 탐지 시스템을 설계하고 구현하였다. 실험 결과, 문장 유사도를 측정함으로써 문장 단위로 표절이 이루어진 경우를 발견할 수 있었고, 어절 유사도를 추가로 측정함으로써 부분표절이 일어난 경우라도 조사나 어미까지 그대로 사용한 표절의 경우 등을 발견할 수 있었다.

KCI등재

3CTC를 적용한 CRNN 기반 한국어 음소인식 모델 연구

저자 : 홍윤석 ( Hong Yoonseok ) , 기경서 ( Ki Kyungseo ) , 권가진 ( Gweon Gahgene )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 8권 3호 발행 연도 : 2019 페이지 : pp. 115-122 (8 pages)

다운로드

(기관인증 필요)

초록보기

지금까지의 한국어 음소 인식에는 은닉 마르코프-가우시안 믹스쳐 모델(HMM-GMM)이나 인공신경망-HMM을 결합한 하이브리드 시스템이 주로 사용되어 왔다. 하지만 이 방법은 성능 개선 여지가 적으며, 전문가에 의해 제작된 강제정렬(force-alignment) 코퍼스 없이는 학습이 불가능하다는 단점이 있다. 이 모델의 문제로 인해 타 언어를 대상으로 한 음소 인식 연구에서는 이 단점을 보완하기 위해 순환 신경망(RNN)계열 구조와 Connectionist Temporal Classification(CTC) 알고리즘을 결합한 신경망 기반 음소 인식 모델이 연구된 바 있다. 그러나 RNN 계열 모델을 학습시키기 위해 많은 음성 말뭉치가 필요하고 구조가 복잡해질 경우 학습이 까다로워, 정제된 말뭉치가 부족하고 기반 연구가 비교적 부족한 한국어의 경우 사용에 제약이 있었다. 이에 본 연구는 강제정렬이 불필요한 CTC 알고리즘을 도입하되, RNN에 비해 더 학습 속도가 빠르고 더 적은 말뭉치로도 학습이 가능한 합성곱 신경망(CNN)을 기반으로 한국어 음소 인식 모델을 구축하여 보고자 시도하였다. 총 2가지의 비교 실험을 통해 본 연구에서는 한국어에 존재하는 49가지의 음소를 판별하는 음소 인식기 모델을 제작하였으며, 실험 결과 최종적으로 선정된 음소 인식 모델은 CNN과 3층의 Bidirectional LSTM을 결합한 구조로, 이 모델의 최종 PER(Phoneme Error Rate)은 3.26으로 나타났다. 이는 한국어 음소 인식 분야에서 보고된 기존 선행 연구들의 PER인 10~12와 비교하면 상당한 성능 향상이라고 할 수 있다.

KCI등재

4가중치 손실 함수를 가지는 순환 컨볼루션 신경망 기반 주가 예측

저자 : 김현진 ( Hyunjin Kim ) , 정연승 ( Yeon Sung Jung )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 8권 3호 발행 연도 : 2019 페이지 : pp. 123-128 (6 pages)

다운로드

(기관인증 필요)

초록보기

본 논문에서는 RCNN (recurrent convolution neural network) 계층 모델을 채택한 인공 지능에 기반을 둔 주가 예측을 제안한다. LSTM(long-term memory model) 기반 신경망은 시계열 데이터의 예측에 사용된다. 다른 한편, 컨볼루션 신경망은 데이터 필터링, 평균화 및 데이터확장을 제공한다. 제안된 주가 예측에서는 위에서 언급 한 장점들을 RCNN 모델에서 결합하여 적용함으로써 다음날의 주가 종가를 예측한다. 그리고 최근의 시계열의 데이터를 강조하기 위해 커스텀 가중치 손실 함수가 채택되었다. 또한 시장의 상황을 반영하기 위해 주가 인덱스에 관련된 데이터를 입력으로 포함하였다. 제안된 주가 예측 방식은 실제 주가를 대상으로 한 실험에서 3.19%로 테스트 오차를 줄였으며, 다른 방법보다 약 19%의 성능 향상을 거둘 수 있었다.

KCI등재

5개체 링킹을 위한 RDF 지식그래프 기반의 포괄적 상호의존성 짝 연결 접근법

저자 : 심용선 ( Yongsun Shim ) , 양성권 ( Sungkwon Yang ) , 김홍기 ( Hong-gee Kim )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 소프트웨어 및 데이터 공학 8권 3호 발행 연도 : 2019 페이지 : pp. 129-136 (8 pages)

다운로드

(기관인증 필요)

초록보기

자연어 표현에는 인물, 조직, 장소, 제품 등의 다양한 개체들이 존재한다. 이러한 개체는 다양한 의미를 가질 수 있다. 이러한 개체가 갖는 중의성 문제는 자연어 처리 분야에 있어 매우 도전적인 과제이다. 개체 링킹(Entity Linking)이란 텍스트에 등장한 개체명을 지식베이스 내의 적절한 개체로 연결해주는 작업이다. 개체 링킹을 위한 대표적인 방법론인 짝 연결 접근법(Pairwise based method)은 한 문장에서 등장한 개체가 두 개 이상일 경우 서로의 연관성을 이용해 개체 링킹을 하는 방법이다. 이 방법은 동일 문장에서 등장하는 개체들 간의 상호의존성(interdependence)만을 고려하고 있어 포괄적인 상호의존성(Global interdependence)이 부족하다는 한계를 갖고 있다. 본 논문에서는 개체 링킹을 위해 RDF 형태의 지식베이스 정보를 바탕으로 Word2vec을 활용한 Entity2vec 모델을 생성하였다. 그리고 생성된 모델을 사용하여 각 개체에 대한 랭킹을 하였다. 본 논문에서는 짝 연결 접근법의 한계점을 보완하기 위해 포괄적인 상호의존성을 바탕으로 짝 연결 접근법을 고안하고 구현 및 실험을 통해 기존의 짝 연결 접근법과 비교하였다.

1
발행기관 최신논문
자료제공: 네이버학술정보
발행기관 최신논문
자료제공: 네이버학술정보

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기