논문 상세보기

한국금융학회> 금융연구> 고빈도 자료를 이용한 머신러닝 모형의 예측력 비교 ․ 분석: KOSPI200 선물시장을 중심으로

KCI등재

고빈도 자료를 이용한 머신러닝 모형의 예측력 비교 ․ 분석: KOSPI200 선물시장을 중심으로

Forecasting Ability of Machine Learning Algorithms using High-frequency Data: KOSPI200 Futures

박석진정재식 ( Suk Jin Park ) , Chae Shick Chung
  • : 한국금융학회
  • : 금융연구 33권4호
  • : 연속간행물
  • : 2019년 12월
  • : 31-60(30pages)

DOI

10.21023/JMF.33.4.2


목차

Ⅰ. 서론
Ⅱ. 선행 연구
Ⅲ. 정보추출(Information Extraction) 모형과 예측모형
Ⅳ. 데이터 및 기초통계량
Ⅴ. 실증 분석
Ⅵ. 결론
<참고문헌>

키워드 보기


초록 보기

본 연구에서는 KOSPI200 선물의 틱(tick) 데이터를 활용하여 머신러닝 모형의 예측력을 분석한다. 첫째, 미시구조론(microstructure)의 함의를 이용해 바(bar)를 구성했을 경우와 둘째, support vector machine, random forest와 같은 머신러닝(machine learning) 모형을 이용했을 경우 선물가격의 상승과 하락 방향에 대한 예측력이 향상되는지를 분석했다. 분석 결과 시장에 새로운 정보가 유입되는 시점을 기준으로 봉을 구성했을 때, 그리고 머신러닝 모형을 이용했을 때 예측력이 더욱 향상되는 것으로 나타났다. 머신러닝 모형의 예측력은 모형의 훈련에 사용되는 데이터의 양이 많아짐에 따라 더욱 향상되는 것으로 나타났다. 특히 거래량의 표본추출 기간을 정보의 유입여부에 따라 조정함으로써 예측력이 향상되었다는 결과는 통상적인 시간에 따라 가격의 상승 하락을 기록하고 분석하는 것은 유의미한 정보의 손실이 있음을 알 수 있다.
This paper investigates the effectiveness of machine learning algorithms and microstructure theory in predicting high frequency price movement. While accurately predicting future prices of financial assets has always been a major concern for the financial sector, recent developments in analytics tools and accessibility to new data have stimulated academics to pursue research.
There are two main ways in which machine learning algorithms are incorporated into financial research. The first is to increase the predictive power of models by adopting machine learning techniques that have not been used in previous studies (Yoon, 2019; Laborda and Laborda, 2017). Secondly, machine learning algorithms are also used to identify new predictive variables (Kim and Joh, 2019; Gentzkow et al., 2017).
On the other hand, there is very little discussion regarding the criteria to construct structured dataset from raw financial data. While microstructure theory argues that active informed traders leave characteristic footprints in market data, incorrectly structured data may fail to extract this information effectively. In this aspect, de Prado(2018a) suggested VIB(volume imbalance bar) based on implications of microstructure theory, which sample bars when informed traders are active.
Therefore, this study examines whether or not VIBs contain predictive information regarding future price movement. Using tick data of KOSPI 200 futures, we constructed VIBs and three standard bar types widely used by practitioners and academics: time bar, tick bar and volume bar. Then, we produced out of sample predictions of one-bar ahead price movement and compared prediction performances of different bar types. In order to test the effectiveness of machine learning algorithms, we used logistic regression as the benchmark and compared the prediction accuracy with SVM(support vector machine) and random forest, two machine learning algorithms widely applied in financial research.
The results of the analysis can be summarized as follows. First, the prediction accuracies of time bar, tick bar and volume bar were no better than a random walk. On the other hand, the prediction accuracy of data constructed with VIB was 65% at least, implying that it contains predictive information regarding future price movement. Chinko et al.(2019) argues that predictive information of returns are sparse and short-lived. Therefore it is better to predict price movements when an information event takes place, and before that information is reflected in the price than predicting them at a random time. This result shows that while VIB incorporates predictive information by effectively identifying the presence of informed traders, standard bar types fail to capture this information.
Second, as the size of training data increases, prediction accuracies of SVM and random forest outperform the prediction accuracy of logistic regression. While there is no significant difference when the training data is small, the gap widens with more training data and eventually resulting in a 5% difference in the biggest training data size. This result implies that machine learning algorithms may enhance prediction accuracy given large data.
This study shows that even though the same raw data is used, prediction accuracy of machine learning algorithms may differ depending on the criteria of how the structured dataset is constructed. Synchronizing bar constructions with information flows may capture predictive information. On the other hand, sampling bars based on chronological time may lead to a significant loss of information. Therefore, while the majority of financial machine learning research focus on model implementation and producing new predictor variables, this research shows that proper construction of structured data is also an important feature.

UCI(KEPA)

간행물정보

  • : 사회과학분야  > 경제학
  • : KCI등재
  • :
  • : 계간
  • : 1225-9489
  • :
  • : 학술지
  • : 연속간행물
  • : 2008-2019
  • : 221


저작권 안내

한국학술정보㈜의 모든 학술 자료는 각 학회 및 기관과 저작권 계약을 통해 제공하고 있습니다.

이에 본 자료를 상업적 이용, 무단 배포 등 불법적으로 이용할 시에는 저작권법 및 관계법령에 따른 책임을 질 수 있습니다.

발행기관 최신논문
| | | | 다운로드

1은행의 수익 및 자산구조를 반영한 통화정책 위험선호경로

저자 : 김의진 ( Uijin Kim ) , 정호성 ( Hosung Jung )

발행기관 : 한국금융학회 간행물 : 금융연구 33권 4호 발행 연도 : 2019 페이지 : pp. 1-30 (30 pages)

다운로드

(기관인증 필요)

초록보기

이 논문에서는 은행에 대한 대표적인 거시건전성 정책수단인 BIS 자기자본규제 비율에서 도출한 은행별 자산에 대한 위험가중치를 이용하여 금리와 은행의 수익 및 자산구조가 은행의 위험수준에 미치는 영향을 살펴보았다. 분석결과, 은행이 내부등급법을 이용하여 자산의 위험수준을 평가하는 경우 단기금리가 상승(하락)하면 은행의 위험수준이 하락(상승)하는 것으로 나타나 우리나라에서 통화정책의 위험선호경로가 작동하고 있음을 확인하였다. 아울러 자본 및 자산구조(자산규모, 대출만기, 단기자산비중), 부채구조(자산대비예금비중), 부실여신비율이 은행의 위험수준에도 통계적으로 유의한 영향을 미치며 특히 이러한 위험선호경로는 기업대출에 대한 위험수준을 중심으로 나타나고 있음을 밝혀냈다. 본 논문은 자기자본규제비율에서 도출한 은행별 위험수준을 이용하여 금리가 은행의 위험수준에 미치는 영향을 살펴본 최초의 시도로 통화정책과 거시건전성 정책과의 상호연계성을 분석하였다는 점에서 의의가 있다고 생각한다.

2고빈도 자료를 이용한 머신러닝 모형의 예측력 비교 ․ 분석: KOSPI200 선물시장을 중심으로

저자 : 박석진정재식 ( Suk Jin Park ) , Chae Shick Chung

발행기관 : 한국금융학회 간행물 : 금융연구 33권 4호 발행 연도 : 2019 페이지 : pp. 31-60 (30 pages)

다운로드

(기관인증 필요)

초록보기

본 연구에서는 KOSPI200 선물의 틱(tick) 데이터를 활용하여 머신러닝 모형의 예측력을 분석한다. 첫째, 미시구조론(microstructure)의 함의를 이용해 바(bar)를 구성했을 경우와 둘째, support vector machine, random forest와 같은 머신러닝(machine learning) 모형을 이용했을 경우 선물가격의 상승과 하락 방향에 대한 예측력이 향상되는지를 분석했다. 분석 결과 시장에 새로운 정보가 유입되는 시점을 기준으로 봉을 구성했을 때, 그리고 머신러닝 모형을 이용했을 때 예측력이 더욱 향상되는 것으로 나타났다. 머신러닝 모형의 예측력은 모형의 훈련에 사용되는 데이터의 양이 많아짐에 따라 더욱 향상되는 것으로 나타났다. 특히 거래량의 표본추출 기간을 정보의 유입여부에 따라 조정함으로써 예측력이 향상되었다는 결과는 통상적인 시간에 따라 가격의 상승 하락을 기록하고 분석하는 것은 유의미한 정보의 손실이 있음을 알 수 있다.

3거시경제변수를 이용한 한국 국채 초과수익률 분석

저자 : 강한길 ( Hankil Kang ) , 이순희 ( Soonhee Lee )

발행기관 : 한국금융학회 간행물 : 금융연구 33권 4호 발행 연도 : 2019 페이지 : pp. 61-89 (29 pages)

다운로드

(기관인증 필요)

초록보기

본 연구는 한국 국채시장에서 초과수익률을 결정하는 요인을 실증적으로 분석한다. 분석에는 Cochrane and Piazzesi(2005)의 선도금리요인과 거시경제변수를 사용하였다. 세부적으로 거시경제 변수는 현재 경제상황을 수치화해서 나타내는 통계자료와 미래 경제상황에 대한 서베이자료, 경제전문가의 경제전망자료를 포함한다. 실증분석 결과, 선도금리요인은 초과수익률에 대해 예측력을 가지지만 Cochrane and Piazzesi와 달리 채권초과수익률을 설명하는 단일요소는 아니며, 장기채권의 초과수익률에 대한 예측력이 단기채권 초과수익률에 비해 낮게 나타났다. 거시경제변수 중에서는, 현재 경제상태를 나타내는 경제지표와 경제전문가의 경제전망지표는 초과수익률에 대한 예측력을 가지고 있지 않았으나, 소비자와 생산자가 미래 경제환경에 대해 가지는 예측정보를 포함하는 서베이자료는 중장기채권 초과수익률에 대해 유의한 설명력을 가지고 있었다. 따라서 한국국채시장의 초과수익률에 대한 정보는 이자율 곡선 내 상당히 포함되어 있으나, 이 외에도 이자율 곡선에 포함되어 있지 않으면서 초과수익률에 대한 예측력을 가지는 요소가 있음을 실증적으로 확인하였다.

4브렉시트와 파운드화의 대 유로화 환율의 변동성과 점프 확률 추정

저자 : 이재득 ( Chae-deug Yi )

발행기관 : 한국금융학회 간행물 : 금융연구 33권 4호 발행 연도 : 2019 페이지 : pp. 91-115 (25 pages)

다운로드

(기관인증 필요)

초록보기

본 연구는 2016년 6월 23일 영국의 브렉시트 투표일을 포함한 2010년 2월 3일부터 2018년 3월 1일까지의 총 관측일수 2,529일을 채택하여 영국 파운드-유로 현물환율의 초고빈도 자료인 5분간 일중자료를 사용하여 영국 파운드화의 대 유로환율 수익률을 비모수적 실현된 파워 변동성을 사용하여 불연속적 점프변동성과 점프 통계량과 점프 발생확률에 대한 추정과 실증분석을 하였다. 2010~2018년 동안 파운드화의 대 유로환율의 실현 수익률(RR) 뿐만 아니라, 실현 변동성(RV), 실현된 수익률의 Bipower 변동성(BV) 모두 비정규분포와 변동성 집중현상과 점프 변동성을 보이고 있으며, 특히 영국의 브렉시트 투표일 후에 실현 변동성이 아주 크게 나타났다. 그리고 영국 파운드화의 대 유로환율의 실현된 수익률의 변동성은 대체로 2010년대에 조금씩 있었다. 그러나 2016년 전후 영국의 브렉시트 투표 전에도 제법 큰 점프가 있었고, 2016년에는 급격하고 아주 큰 점프가 발생하였으며 그 후로도 비교적 큰 변동성이 발생하였다. 영국 파운드화의 대 유로환율 변동성의 점프통계량 검정결과, Tripower를 사용했을 때 가장 일반적인 수준인 α = 0.999의 경우에는 총 2,529일 중에서 점프가 409번 일어나서 점프가 발생할 확률이 16.17%를 기록하였다. 마지막으로 일반적 유의수준인 α = 0.999인 경우에는 Quad-power를 사용하였을 때, 총 2,529일 중에서 점프가 461번 일어나서 점프가 발생할 확률이 18.23%를 기록하고 있다. 이와 같이 2010년대 들어 파운드- 유로화 환율은 비교적 점프가 많이 일어났고 브렉시트 전후로 통계적으로 유의한 환율 점프가 크게 발생하였다는 것을 알 수 있다.

1
주제별 간행물
간행물명 수록권호

KCI등재

경제사학
71권 0호 ~ 71권 0호

KCI등재

한국경제학보(구 연세경제연구)
26권 2호 ~ 26권 2호

KCI등재

부동산학연구
26권 1호 ~ 26권 1호

Korean Economic and Financial Review
25권 1호 ~ 25권 1호

주간금융브리프
29권 3호 ~ 29권 5호

재정포럼
283권 0호 ~ 284권 0호

VIP Report
735권 0호 ~ 736권 0호

한국경제주평
869권 0호 ~ 872권 0호

KCI등재

보험금융연구
98권 0호 ~ 98권 0호

KCI등재

한국물류학회지
30권 1호 ~ 30권 1호

해양한국
2020권 3호 ~ 2020권 3호

충남경제
2020권 2호 ~ 2020권 2호

지방세포럼
49권 0호 ~ 49권 0호

KCI등재

금융정보연구
9권 1호 ~ 9권 1호

KCI등재

경제연구
38권 1호 ~ 38권 1호

협상연구
22권 2호 ~ 22권 2호

해양한국
2020권 1호 ~ 2020권 2호

KCI등재

경상논총
37권 4호 ~ 37권 4호

KCI등재

동북아경제연구
31권 3호 ~ 31권 3호

KIPF 공공기관 이슈포커스
32권 0호 ~ 32권 0호
발행기관 최신논문
자료제공: 네이버학술정보
발행기관 최신논문
자료제공: 네이버학술정보

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기