I. 연구의 목적
▣ 국내 주식시장에서는 기관투자자, 외국인투자자, 개인투자자의 종목별, 일별 순매수도 금액이 발표되는데 기관투자자 및 외국인투자자의 투자행태와 관련된 정보는 투자전략 결정에 있어서 유용한 정보가 될 수 있을 것으로 추정된다.
· 일반적으로 기관투자자 및 외국인투자자가 주식시장에 대한 분석력 및 개별주식 종목에 대한 정보 구득 측면에서 개인투자자보다 상대적으로 우위에 있다는 많은 실증적 연구가 있다.
▣ 기술적 분석(technical analysis)은 회사의 기본정보에 기반한 기초분석(fundamental analysis)에 대비되는 개념으로 실질적 활용도가 높은 주가 예측 방법이다.
· 기술적 분석에서는 가격, 거래량 등 시장변수에 기반하여 향후 주가를 예측하는데, 동 방법론에 기반하여 다양한 기술적 지표(technical indicators)가 개발되어 주식의 매수/매도 시점을 제시해준다.
▣ 본 연구의 목적은 개인투자자보다 상대적으로 정보 우위일 것으로 추정되는 기관투자자/외국인투자자의 주식매매 정보를 이용 또는 모방한(imitating) 투자전략의 유효성 여부를 검증하는 것이다.
▣ 이를 위해서 기관투자자와 외국인투자자의 국내 주식시장에서의 순매수량 관련 데이터를 이용한 클러스터 분석과 기술적 분석에 의거한 매수/매도 신호를 이용하여 월별 국내 주식 포트폴리오 종목을 선정한 후, 동 포트폴리오의 구성비율(weight)을 유전자 알고리듬(genetic algorithm)에 기반하여 최적화하는 투자 전략을 제시한다.
· 이러한 주식투자 포트폴리오의 성과를 시뮬레이션 분석함으로써 기관투자자 또는 외국인투자자를 추종하는 투자전략이 어떠한 성과를 가져오는지를 실증적으로 분석하고자 한다.
Ⅱ. 연구 방법(research design)
1. 투자자 정보(investors information)
▣ 본 연구에서는 국내 주식시장에서의 투자자 그룹을 외국인투자자, 기관투자자, 개인투자자로 분류한다. 일반적으로 외국인투자자, 기관투자자 그룹이 개인투자자에 비해 상대적으로 정보 우위에 있으며 중장기적 투자를 하는 것으로 알려져 있다.
· 외국인투자자 또는 기관투자자의 개인투자자 대비 상대적 정보 우위 여부 및 만약 정보 우위가 존재한다면 그 근본적 원인은 다양할 것으로 추정된다.
▣ 우선 포트폴리오 구성 종목군을 선정함에서 있어서 투자자 정보를 활용하는데 우선 클러스터 분석(cluster analysis)을 통해 외국인투자자/기관투자자/개인투자자별로 특정기간(t0~t1) 동안의(순매수/총매매) 비중인 TVP(trading volume propor-tion)에 기반하여 포트폴리오 구성대상 종목군을 선별한다.
▣ 클러스터 분석은 데이터를 유사한 성격의 그룹으로 분류하는 방법으로서 본 연구에서는 클러스터 분석방법 중에서 가장 많이 사용되고 있는 k-means 클러스터 분석방법을 사용한다.
· 각 클러스터의 중심점(centroids 또는 means)을 기준으로 전체 데이터를 k개 클러스터로 분류하는 방법이다. 본 연구에서는 우선 k를 3으로 설정하여 각 투자자별로 (외국인 : high, middle, low), (기관 : high, middle, low), (개인 : high, middle, low)의 각각 3개의 클러스터로 분류한다.
2. 기술적 분석(technical analysis)
▣ 기술적 분석(technical analysis)이란 회사의 기본정보에 기반한 기초적 분석(fundamental analysis)에 대비되는 개념으로서, 가격, 거래량 등 시장변수에 기반하여 향후 주가를 예측하는 방법으로 실질적 활용도가 높다.
· 본 연구에서는 Jiah-Shing Chen 외(2009)의 연구에서 사용된 9개의 대표적으로 많이 통용되고 있는 기술적 지표를 사용한다.
▣ 포트폴리오 구성종목을 선별하기 위해서 클러스터 분석에 의거하여 선별된 포트폴리오 구성대상 종목군(예 : 외국인 순매수 high 종목군, 또는 기관투자가 순매수 high 종목군)을 대상으로 하여 2차적으로 기술적 지표(technical indicators)에 의거하여 특정기간(t0~t1) 동안의 매수(buy) 신호와 매도(sell) 신호의 발생 여부 및 신호 개수에 기반하여 종목군을 세분화하는 과정을 거친다.
· 외국인투자자, 기관투자자별로 각각 이상의 두 가지 방법(투자자 정보기반 클러스터 분석, 기술적 지표 매수/매도 신호발생여부)에 의거하여 포트폴리오 구성대상 종목군을 다양하게 분류할 수 있다.
▣ 포트폴리오 구성대상 종목을 세분화한 후에는 투자자 입장에서 아래와 같은 다양한 포트폴리오 구성 전략을 상정해 볼 수 있다.
· 첫째, 포트폴리오 구성 시 ‘보유 전략’(long only)으로서 일반적인 투자자가 공매(short)가 불가능한 환경 하에서 주식 보유만 가능할 때 사용하는 방법이다.
· 둘째, ‘보유 및 공매도 전략’(long and short)은 일반적으로 헤지펀드 등이 주로 사용하는 전략이다. 예를 들어 향후 주가 상승이 예상되는 종목을 매수 보유하고, 주가 하락이 예상되는 종목을 공매도하여 수익률 극대화를 추구하는 전략이다.
▣ 본 연구에서는 ‘보유 전략’(long only) 중에서 1) (기관 순매수 high) & (매수 신호 4개 이상 발생), 2) (외국인 순매수 high) & (매수 신호 4개 이상 발생) 의 두 가지 포트폴리오 구성 종목군을 대상으로 시뮬레이션을 실시한다.
가. 기술적 지표
1) CCI(Commodity Channel Index)
▣ 최근 가격이 평균가격의 이동평균과 얼마나 떨어져 있는지를 표시하여 추세의 강도와 방향을 나타내주는 지표이다.
· CCI = (X-Y) / (Z*0.015)로 계산하여 도출한다. 여기서 X는 당일 고가, 당일 저가, 당일 종가의 합을 3으로 나눈 평균값이고 Y는 X의 14일 동안의 단순이동평균값이며, Z는 14일 동안의 X, Y의 차의 절대값들의 합을 14로 나눈 평균값이다. 매수 신호는 CCI가 -100선을 상향 돌파 시이며, 매도 신호는 CCI가 +100선을 하향 돌파 시이다.
2) MOM(Momentum)
▣ 일정기간 동안 변동한 주가의 양을 측정하는 지표이다. MOM은 당일 종가를 10일 전 종가로 나눈 값에 100을 곱한 후, 그 값에 100을 빼줌으로써 도출된다.
· 매수 신호는 MOM이 0선을 상향 돌파 시이며, 매도 신호는 MOM이 0선을 하향 돌파 시이다.
3) RSI(Relative Strength Index)
▣ 일정기간 동안의 주가 등락 중 상승폭과 하락폭이 어느 정도인지를 분석하는 지표로써, 추세 전환 예측 시에 사용한다.
· RSI = 100-100/(1+RS) 로 계산한다. 여기서 RS는 당일을 제외한 최근 14일 동안 종가의 평균상승폭을 당일을 제외한 14일 동안 종가의 평균하락폭으로 나눈 값이다. 매수 신호는 RSI가 30을 하향 돌파 시이며, 매도 신호는 RSI가 70을 상향 돌파 시이다.
4) DMI(Directional Movement Index)
▣ 전일 대비 현재가의 고가, 저가, 종가의 최고값을 이용하여 추세와 매수, 매도 시점을 판단하는 지표로써, 시장 방향성 지표이다.
· +DI는 +DM의 14일 단순이동평균값을 TR(True Range)의 14일 단순이동평균값으로 나눈 값이고, -DI는 -DM의 14일 단순이동평균값을 TR의 14일 단순이동평균값으로 나눈 값이다. 여기서 TR은 당일 고가와 당일 저가의 차, 전일 종가와 당일 고가의 차의 절대값, 전일 종가와 당일 저가의 차의 절대값 중에서 가장 큰 값이다. +DM은 당일 고가와 전일 고가의 차가 0보다 크고 당일 고가와 전일 고가의 차가 전일저가와 당일 저가의 차보다 클 경우에는 당일 고가와 전일고가의 차, 그렇지 않을 경우에는 0으로 계산된다. -DM은 전일 저가와 당일 저가의 차가 0보다 크고 당일 고가와 전일 고가의 차가 전일 저가와 당일 저가의 차보다 작을 경우에는 전일 저가와 당일 저가의 차, 그렇지 않을 경우에는 0으로 계산된다. 매수 신호는 +DI가 -DI를 상향 돌파 시이고, 매도 신호는 +DI가 -DI를 하향 돌파 시이다.
5) MACD(Moving Average Convergence-Divergence)
▣ 이동평균선들의 수렴과 확산, 즉 이동평균선들 간의 차이를 보기 쉽게 나타낸 지표이다.
· MACD는 12일 단기 이동평균선에서 26일 장기 이동평균선을 빼줌으로써 도출된다. 0선은 지표값의 양/음을 나타내는 기준선(직선)이다. 매수 신호는 MACD가 0선을 상향 돌파시이고, 매도 신호는 MACD가 0선을 하향 돌파 시이다.
6) KD(Stochastics Oscillator)
▣ 일정 기간의 주가 변동폭 중 금일 종가의 위치를 백분율로 표시한 지표이다.
· %K는 금일 종가와 최근 14일 중 최저가의 차를 최근 14일 중 최고가와 최근 14일 중 최저가의 차로 나눈 값에 100을 곱하여 도출하고, %D는 %K의 3일 이동평균값이다. 매수 신호는 %K가 %D를 상향 돌파 시이고, 매도 신호는 %K가 %D를 하향 돌파 시이다.
7) WMS %R(Williams % Range)
▣ 적용기간 중 움직인 가격 범위에서 오늘 시장가격이 상대적으로 어디에 위치하는지를 알려주는 지표이다.
· 당일을 제외한 최근 14일 중 최고가와 당일 종가의 차를 당일을 제외한 최근 14일 중 최고가와 당일을 제외한 최근 14일 중 최저가의 차로 나눈 후 -100을 곱하여 도출한다. 매수신호는 WMS %R이 -80을 상향 돌파 시이고, 매도 신호는 WMS %R이 -20을 하향 돌파 시이다.
8) Qstick
▣ 캔들의 몸통 크기를 이동평균한 값을 통해 주가의 변동성을 파악하는 지표이다.
· Qstick은 4일 동안의 종가와 시가의 차를 모두 더한 후 4로 나누어 도출한다. 즉, 4일 간 종가와 시가 차의 평균이다. Signal은 Qstick의 9일 이동평균값이다. 매수 신호는 Qstick이 Signal을 상향 돌파 시이고, 매도 신호는 Qstick이 Signal을 하향 돌파 시이다.
9) PSY(Psychological Line)
▣ 시장의 심리상태를 판단하는 지표이다. 최근 12일 동안의 주가(종가 기준)를 전일 대비 상승일수와 하락일수를 계산하여 12일 중 상승일수의 비율로 나타낸다.
· PSY는 당일을 제외한 최근 12일 중 주가 상승일수를 12로 나눈 후 100을 곱하여 계산한다. 매수 신호는 PSY가 25를 하향 돌파 시이고, 매도 신호는 PSY가 75를 상향 돌파 시이다.
3. 유전자 알고리듬(genetic algorithm)
▣ 유전자 알고리듬은 유전자가 세대를 넘어서 진화하는 과정에서 목격되는 선택(selection), 교차(cross over), 돌연변이(mutation) 등의 기제에 기반한 경험적(heuristic) 진화론적 계산(evolutionary computation) 알고리듬이다.
· 유전자 알고리듬이 재무적 연구에 응용된 사례(financial application)의 범위는 무위험거래(arbitrage), 파산 예측(bankruptcy detection), 자금관리(cash management), 신용 포트폴리오(credit portfolio), 기초적 분석(fundamental analysis), 예측(forecasting), 인덱스 추적(index tracking), 시장 시뮬레이션(market simulation), 구매(procurement), 포트폴리오 최적화(portfolio optimization), 주식매매(trading) 등 매우 광범위하다.
▣ 기존의 평균-분산(mean-variance)에 기반한 2차원적 최적화(quadratic optimization)를 통한 현대 포트폴리오 이론(modern portfolio theory)에서 외연을 확장하여 다양한 위험 개념 및 제약조건 하에서 포트폴리오 최적화의 연구에 유전자 알고리듬이 유용하게 응용되고 있다.
· Wang 외(2014)는 가중예상숏폴(weighted expected short-fall)이라는 위험개념(risk measure)에 기반한 포트폴리오 최적화문제에 유전자 알고리듬을 응용하였다.
· Hochreiter(2014)는 위험패리티(risk parity) 포트폴리오 최적화문제에 유전자 알고리듬을 응용하였다.
· Rankovic 외(2014)는 밸류엣리스크(Value-at-Risk)에 기반하여 포트폴리오의 위험을 정의하고 포트폴리오 최적화문제에 유전자 알고리듬을 응용하였다.
▣ 본 연구에서는 유전자 알고리듬을 포트폴리오 구성 종목의 구성비 최적화 과정에 응용한다.
· 이 경우 비 정형적 최적화 시에 발생할 수 있는 지역 해(local optimum)에 고립되는 문제 등을 해결할 수 있는 차원에서 포트폴리오 구성 종목의 숫자가 많지 않을 경우에 상대적 장점이 있다.
▣ 유전자 알고리듬의 주요 오퍼레이터(genetic operator)인 선택(selection), 교차(cross over), 돌연변이(mutation) 3개를 일정 수렴조건이 만족될 때까지 반복적으로 적용하게 된다.
가. 유전자 알고리듬 적용 업무단계
1) 초기화(initialisation)
▣ 첫 단계는 우선 구하고자는 목표를 나타내는 解 공간(solution domain)을 유전적 표시(generic representation)로 정의하는 것부터 시작한다.
· 우선 유전정보의 기초단위인 유전자(gene)를 정의하고 개인의 유전정보를 나타내는 유전자 결합으로 정의되는 크로모좀(chromosome)을 정의할 필요가 있다.
· 크로모좀의 집합체를 전체 인구(population)라고 정의한다.
▣ 본 연구의 포트폴리오 구성비 최적화 응용사례에서는 크로모좀을 포트폴리오 구성 종목의 구성비율 ωp(ω1ω2, …, ωk)로 정의할 수 있다.
2) 적합함수(fitness function)의 정의
▣ 적합함수는 각 크로모좀이 다음 세대로 존속(reproduction)하기 위해 최적화하는 목적함수(objective function)의 성격이다.
· 일반적으로 높은 적합함수 값을 보유한 크로모좀이 다음 세대로 존속할 가능성이 높아지는 ‘적자생존’(survival of fittest)의 진화론적 사고에 근거한다.
▣ 본 연구에서 크로모좀의 적합함수는 1)단위 위험(포트폴리오의 변동성)대비 무위험수익률 대비 초과수익을 나타내는 샤프비율(Sharpe Ratio), 또는 2)변동성을 대표하는 포트폴리오의 분산(variance)의 두 가지 경우를 분석한다.
3) 선택(Selection)
▣ ‘선택(selection)’의 과정은 가장 적합한(fittest) 크로모좀을 선택하고 동 유전자 정보를 다음 세대(next generation)로 이전하는 과정이다.
· 크로모좀의 적합함수 가치(fitness value)에 기반하여 가장후세대를 생산하기에 적합한 한 쌍의 적합한 부모(fit parents chromosome)를 선정하게 된다.
▣ 자연 현상에서 발견되는 ‘선택’의 과정은 다음과 같은 다양한 양태를 보이고 있다.
· 첫 번째는 소위 확률적 선택(stochastic universal selection, fitness proportionate selection) 또는 룰렛 휠 선택
(roulette wheel selection)으로 통칭되는 방법으로서, 각 크로모좀의 적합함수 가치(fitness value)에 비례하게 룰렛판의 면적을 구성하도록 하고 룰렛을 무작위로 두 번 돌려서 나온 결과를 선택된 부모 크로모좀(fit parents chromosome)으로 선정하는 것이다.
· 두 번째는 순위 선택(ranking selection)의 방법으로서, 동방법은 크로모좀의 적합함수 가치에 따른 크로모좀의 순위(rank)에 따라 룰렛 판의 면적을 사전적으로 결정하고 룰렛을 무작위로 두 번 돌려서 나온 결과를 선택된 부모 크로모좀(fit parents chromosome)으로 선정하는 것이다.
· 세 번째는 엘리티스트 보존 선택(elitist preserving selection)의 방법으로서, 동 방법은 가장 높은 적합함수 가치를 가진 크로모좀(Elitist)은 반드시 다음 세대로 이전하는 방식이다.
· 네 번째는 토너먼트 선택(Tournament Selection)의 방법으로서, 동 방법은 인구(population)내에서 무작위 토너먼트경쟁을 실시하고 동 토너먼트의 승자를 다음 세대로 이전하는 방법이다.
▣ 이상에서 설명된 다양한 ‘선택’의 방법론 중에서 본 연구는 가장 많이 사용되고 있는 확률적 선택(Stochastic Universal Selection)을 사용한다.
4) 교차(crossover)
▣ 두 번째 유전자 오퍼레이터는 ‘교차(crossover)’로서 부모 간의 유전형질(gene)을 상호 교차하여 새로운 세대를 구성하는 과정이다.
· 동 과정을 통해 장기적으로 적합함수 가치(fitness value)가높은 유전형질 간의 교배를 통해 유전형질이 좋은 자손세대를 형성하는 원리가 작동한다.
5) 돌연변이(mutation)
▣ 세 번째 유전자 오퍼레이터는 ‘돌연변이(mutation)’로서, 이는 동일 크로모좀 내의 유전형질(gene)이 무작위로 소폭 변화하는 것을 지칭한다.
· 낮은 확률로 일어나는 돌연변이를 통해 인구의 다양성을 유지하고 조기 수렴현상(premature convergence)이 방지된다.
6) 반복(iteration) 및 종료(termination)
▣ 세 가지 유전 오퍼레이터 선택(selection), 교차(crossover), 돌연변이(mutation)의 과정을 반복하여 특정 수렴기준(conver-gence criterion)을 충족시키면 알고리듬을 종료하게 된다.
· 수렴의 기준은 일반적으로 첫째, 세대 간의 차이가 일정 수준 미만으로 나타나면서 인구(population)가 수렴하는 경우 또는 둘째, 반복 횟수의 최대한도를 정하고 동 최대치에 이를 때까지 반복하는 경우 등을 사용한다.
Ⅲ. 포트폴리오 구성 및 데이터
1. 포트폴리오 구성
▣ 유전자 알고리듬의 적합함수(fitness function)는 1)샤프 비율(Sharpe ratio)을 극대화하는 경우와 2)분산(variance)을 최소화하는 경우 두 가지의 경우를 분석하였다.
▣ 본 연구와 같이 포트폴리오 구성 종목 수가 작을 경우에는 전통적 최적화 방법은 편향적(biased)이거나 코너(corner)解를 가져올 우려가 있으며 유전자 알고리듬이 더 적합한 최적화 방법일 것으로 추정된다.
▣ 본 연구에서는 R 프로그램에 내재된 유전자 알고리듬 패키지를 사용하였고 사용된 파라미터에 대해 인구 규모(population size)는 200, 교차비율(crossover rate)은 0.5, 돌연변이 비율(mutation rate)은 0.06, 반복횟수(iteration) 즉 진화되는 세대수(the number of generations)는 500으로 하였다.
▣ 또한 선택(selection)과정은 가장 보편적으로 사용되는 확률적 선택 방법을 사용하였고 동 알고리듬은 R 프로그램에 내재되어 있다.
▣ 유전자 알고리듬을 이용한 포트폴리오 구성비의 최적화를 위해서는 최적화 과정의 트레이닝 기간(training period)과 테스트 기간(testing period)을 설정할 필요가 있다.
· 본 연구에서는 트레이닝 기간과 테스트 기간을 이동 시간 창구(sliding time window) 방식으로 지속적으로 연속(rolling)시키면서 매 시간 창구별로 포트폴리오를 지속적으로 조정(adjustment)해 나간다.
· 구체적으로 (트레이닝 기간, 테스트 기간) 조합을 (1개월, 1개월), (6개월, 1개월)의 두 가지 방법을 사용하였다.
▣ 전체 샘플기간(0~T)은 2010년 1월부터 가장 최근 월인 2019년 8월까지로 설정하였다.
· (트레이닝 기간, 테스트 기간)=(1개월, 1개월), 또는 (6개월, 1개월)의 방식에 따라 각각 115개월(2010년 2월~2019년 8월)과 110개월(2010년 7월~2019년 8월)의 실질적인 테스트기간이 설정된다.
▣ 한편 시뮬레이션 결과를 분석함에 있어서 (n-1)월 말일까지 발생하는 기관/외국인의 순매수 금액 및 기술적 지표 등 모든 정보를 반영하여 n월 1일 시장 개시 전에 포트폴리오를 구성하여 n월 1일 시초가로 모든 포트폴리오 종목을 매입하고 n월말일 종가에 포트폴리오를 매도하는 방식으로 월별 포트폴리오를 평가하였다.
▣ 포트폴리오 종목군 선별에 있어서 트레이닝 기간이 1개월인 경우와 6개월인 경우에 공히 (기관/외국인 순매수 비중 고(high) 클러스터)와 (기술적 지표 순매수 신호 4개 이상 발생)이 동시에 해당하는 종목군을 선정하였다.
· 기술적 지표의 파라미터(일수(n) 및 지표별 한계치(threshold))설정과 관련하여서는 지표별로 상이한 특성을 가지고 있기 때문에 투자업계에서 가장 실무적으로 활용도가 높게 적용되고 있는 경우를 참조하여 파라미터를 채택했다.
· 또한 매수/매도 신호 발생여부의 결정은 해당 월 중에서 해당 신호가 한 번이라도 발생하면 해당 신호가 발생하는 것으로 인정하였다.
▣ GA에 의한 포트폴리오 최적화의 두 가지 경우(적합함수가 샤프비율 또는 분산)에 추가하여 비교 분석을 위해서 종목별 동일 비중(equal weight) 포트폴리오와 종목별 시가총액 비중(market capitalization weight) 포트폴리오를 시뮬레이션 분석하였다.
2. 데이터
▣ 데이터는 2010년 1월부터 2019년 8월까지 KOSPI 200 종목군을 대상으로 한다.
· KOSPI 200 종목군 중 샘플기간 동안 추가 편입 및 퇴출, 상장폐지, 거래정지 등으로 데이터의 연속성이 저해되는 종목들은 샘플 데이터에서 제외시키고 샘플 분석기간 동안 변함없이 데이터 확보가 가능한 종목만을 선별하여 총 114개 종목군을 분석대상으로 한다.
▣ 포트폴리오의 성과를 비교 분석하기 위한 벤치마크 인덱스는 KOSPI, KOSPI200, 114개 분석 종목군으로 구성된 포트폴리오의 시가 총액 기준 인덱스(이하, KOSPI114로 명칭)의 3가지를 사용한다.
Ⅳ. 시뮬레이션 결과
▣ 투자자 정보와 기술적 지표에 의거하여 선정된 포트폴리오 구성 종목 수의 기초통계량을 살펴보면 전반적으로 외국인의 경우가 기관투자가에 비해서 구성 종목 수의 평균(mean), 중위수(median) 등에서 상대적으로 큰 것으로 나타난다.
▣ 포트폴리오 구성 종목이 부재한 기간에는 포트폴리오를 구성치 않고 현금 또는 무위험자산으로 포트폴리오를 운용하는 것으로 상정하여 동 기간에 무위험자산을 보유하는 것으로 하여 동 기간의 수익률은 무위험수익률(CD 수익률)에 해당하는 것으로 가정하였다.
▣ 포트폴리오의 구성을 매월 조정하게 되므로 포트폴리오 매매에 수반되는 거래비용을 고려할 필요가 있다. 우선 거래비용을 무시한 시뮬레이션 결과를 가지고 일정한 수준의 거래비용을 가정하고 어떠한 결과를 가져올지 추정해보도록 한다.
▣ 시뮬레이션 결과는 다음과 같은 가설(hypothesis) 또는 시사점(implication)으로 요약해 볼 수 있을 것이다.
▣ 첫째, (트레이닝 기간, 테스트 기간) 조합이 (1개월, 1개월)일때, 기관 투자자의 경우 본 연구에서 제시된 방법론에 의해 투자자 정보 및 기술적 지표에 의한 포트폴리오 종목을 구성하고 GA 방법을 통해 포트폴리오 구성비를 최적화한 투자전략이 비교대상 벤치마크(KOSPI114)보다 수익률 및 샤프비율(Sharpe ratio) 관점에서 우월한 결과를 제시하고 있다.
· 기관투자자의 경우 월 평균수익률은 GA(샤프비율)=2.17% > GA(분산)=2.15% > EW(종목별 동일 비중 포트폴리오)=2.00% > MC(종목별 시가총액 비중 포트폴리오)=1.98% 순으로 결과가 나왔으며 이는 벤치마크 KOSPI114의 월 평균수익률 0.42%보다 월등히 높은 수익률 수준을 보이고 있다.
▣ 거래비용을 감안치 않았을 때 GA(샤프비율)을 기준으로 기관투자자의 경우 월 평균 1.75%p(2.17%-0.42%), 연 평균 20.09%p(24.94%-4.85%) 상대적 초과 성과(out performance)를 보이고 있다.
· 거래비용을 감안하고도 월 평균 1.34%p(1.75%p-0.41%p)의 상대적 초과수익률을 보이고 있다.
▣ 따라서 본 연구에서 제시하는 투자자 정보와 기술적 분석에 의한 포트폴리오 종목 선정과 GA 방법론에 의한 포트폴리오비중 최적화의 투자전략이 실제 투자전략으로 유효할 수 있음을 보여준다.
▣ EW(종목별 동일 비중 포트폴리오)와 MC(종목별 시가총액 비중 포트폴리오)의 경우에도 벤치마크인 KOSPI114보다는 거래비용을 감안하더라도 상대적 초과성과를 보이고 있다.
· 이는 투자자 정보와 기술적 지표를 이용하여 포트폴리오 구성 종목을 선정하는 것만으로도 벤치마크 대비 상당한 초과성과가 가능함을 시사한다.
▣ 한편 기관투자가의 경우 EW(종목별 동일 비중 포트폴리오)대비 GA방법론을 이용한 포트폴리오의 구성비 최적화 과정은 GA(샤프비율)의 경우 월 평균 0.17%p(2.17%-2.0%), GA(분산)의 경우 월 평균 0.15%p(2.15%-2.0%)의 수익률 제고 효과가 있는 것으로 나타난다.
▣ GA로 최적화한 포트폴리오의 성과는 벤치마크 대비 매우 높은 변동성을 보인다. 또한 GA로 최적화한 포트폴리오는 EW(종목별 동일 비중 포트폴리오)와 MC(종목별 시가총액 비중포트폴리오)와 비교하여서도 약간 높은 변동성을 보인다.
▣ 한편 기관투자자의 경우에 4가지 전략의 사후적 샤프비율을 비교하면 MC(종목별 시가총액 비중 포트폴리오) > GA(샤프비율) > GA(분산) > EW(종목별 동일 비중 포트폴리오)의 순서로 나타나며 그 차이는 미미한 수준이다.
▣ 둘째, (트레이닝 기간, 테스트 기간) 조합이 (1개월, 1개월) 일때, 외국인투자자의 경우 월 평균수익률 관점에서 4가지 투자전략의 투자성과의 순서는 GA(샤프비율) > GA(분산) > EW(종목별 동일 비중 포트폴리오) > MC(종목별 시가총액 비중 포트폴리오)의 순서로서 기관투자자의 경우와 동일한 순서이다.
· 그러나 EW(종목별 동일 비중 포트폴리오)와 MC(종목별 시가총액 비중 포트폴리오)의 투자성과는 벤치마크인 KOSPI 114보다 월 평균수익률 관점에서 열등한 성과를 보이고 있다.
▣ 외국인투자자의 경우 GA(샤프비율) 전략만이 월 평균수익률 기준 거래비용 미 감안시 0.58%p(1.0%-0.42%), 거래비용 감안시 0.17%p(0.58%p-0.41%p) 수준의 벤치마크 대비 상대적 초과성과를 보이고 있다. 나머지 세 가지 투자전략은 거래비용을 감안할 경우에는 벤치마크 대비 초과성과를 보이지 못하고 있다.
▣ 결론적으로 (트레이닝 기간, 테스트 기간) 조합이 (1개월, 1개월)일 때, 외국인투자자의 경우 본 연구가 제시하는 투자전략이 기관투자자에 비해 상대적으로 매우 저조한 성과를 보이고 있다.
▣ 기관투자가가 외국인투자가보다 수익률 차원에서 절대 우위를 보이고 있는 것에 대한 근본적 이유를 찾기는 쉽지 않다.
· 예를 들어 기관투자자와 외국인투자자 간의 결과를 수익률이 아닌 샤프비율 차원에서 비교하면 기관투자자가 우위의 결과를 보여주지만 상대적으로 소폭 우위에 그치고 있다.
· 또한 외국인들의 국내 주식시장에서의 투자행태는 단순한 원화 기준의 투자성과가 아닌 자국통화 또는 국제적 기축통화인 달러 기준으로 투자전략을 구사하므로 동 기간의 원/달러 환율추이에도 많은 영향을 받을 수 있다.
▣ 셋째, (트레이닝 기간, 테스트 기간) 조합을 (1개월, 1개월)에서 (6개월, 1개월)로 변경하자 기관투자자와 외국인투자자의 상대적 우열이 뒤바뀌어 외국인투자자의 성과가 기관투자자 보다 상대적으로 양호하게 나온다.
· 이상의 결과에 대한 해석은 주의를 요한다. 일면 외국인들이 기관투자자에 비해서 상대적으로 좀 더 장기적인 투자시계(investment horizon)를 가지고 투자한다고 추측할 수도 있을 것이다.
· 이러한 시뮬레이션의 타임 윈도우 구성방법은 투자자의 투자시계(investment horizon)와 관련된 것으로서 일률적인 방법론이 없고 다양한 시도를 통해서 최적화하는 것이 바람직할 것이다.
Ⅴ. 결론 및 향후 연구
▣ 본 연구에서는 개인투자자 보다 상대적 정보우위에 있을 것으로 추정되는 기관투자가 및 외국인투자가의 투자전략을 추종하는 포트폴리오 최적화를 통해서 헤지펀드 성격의 투자전략의 가능성을 탐색해 본다.
▣ 시뮬레이션 결과는 상당히 고무적이다. (트레이닝 기간, 테스트 기간) 조합이 (1개월, 1개월)일 때, 우선 기관투자가의 경우 매월 포트폴리오를 일괄적으로 교체한다는 가정 하에서 거래비용을 감안하더라도 월 평균수익률 기준 1.34%p의 벤치마크대비 초과수익을 보이는 것으로 나타난다.
· 동 초과수익 중에서 GA방법론을 이용한 포트폴리오의 구성비 최적화 과정은 EW(종목별 동일 비중 포트폴리오) 대비 월평균 0.17%p의 수익률 제고 효과가 있는 것으로 나타났다.
▣ 한편 외국인투자자는 기관투자자에 비해 수익률 차원에서 상대적으로 저조한 결과를 보이고 있다. 기관투자자가 외국인투자자에 비해 상대적으로 우월한 결과를 보이는 것에 대한 해석은 다양한 기저 요인에 기반할 수 있으며 이에 대해서는 추가적인 연구가 필요할 것이다.
▣ 한편 포트폴리오의 구성비를 최적화하는 유전자 알고리듬의(트레이닝 기간, 테스트 기간) 조합을 (1개월, 1개월)에서 (6개월, 1개월)로 변경하면 기관투자자와 외국인투자자의 수익률 및 샤프비율 관점의 상대적 우위가 뒤바뀌는 결과가 나타난다.
▣ 본 연구의 후속 작업으로 생각해볼 수 있는 향후 연구주제는 다음과 같다.
· 본 연구에서는 주식 보유(long only)전략 만을 고려하였으나 보유(long) 및 공매(short)를 동시에 고려한 헤지펀드 스타일의 포트폴리오 구성 전략을 시뮬레이션하는 것도 가능하다.
· 시뮬레이션의 타임 윈도우를 구성하는 방법은 투자자의 투자시계(investment horizon)와 관련된 것으로서 일률적인 방법론이 없고 다양한 시도를 통해서 최적화하는 것이 바람직할 것이다.
· 기술적 지표의 매수 신호 발생 일별 시점으로 설정하여 월별포트폴리오 재조정이 아닌 실질적 일별 포트폴리오 재조정(daily dynamic portfolio adjustment) 방안도 고려해 볼 수 있다.
· 이 외에도 타 투자전략, 예를 들어 액티브 스타일 공모펀드와의 상대적 비교 우위 여부 분석, 기관투자자 중에서도 제일 높은 위상 및 정보력을 가지고 있는 국민연금의 종목별투자 정보를 이용한 투자전략 구성 방안 등 다양한 응용사례를 향후 연구주제로 생각해 볼 수 있다.
This study is about seeking a plausible investment strategy of KOSPI 200 stocks based on investors information, technical indicators, and genetic algorithm. First, the portfolio stock selection process is two folds; 1) the clustering analysis of net trading volume of foreign investors and institutional investors, respectively. 2) the number of technical indicators signal; ‘buy’ or ‘sell’. Second, the weight of selected stocks in the portfolio is optimized using a genetic algorithm. The genetic algorithm is a heuristic evolutionary computation method based on ‘selection’, ‘cross over’, and ‘mutation’. The simulation result shows that the proposed stock investment strategy outperforms the benchmark index, net of maximum assumable monthly trading cost.