간행물

한국통계학회> 응용통계연구

응용통계연구 update

The Korean Journal of Applied Statistics

  • : 한국통계학회
  • : 자연과학분야  >  통계학
  • : KCI등재
  • :
  • : 연속간행물
  • : 격월
  • : 1225-066x
  • : 2383-5818
  • :

수록정보
수록범위 : 1권1호(1987)~33권3호(2020) |수록논문 수 : 1,880
응용통계연구
33권3호(2020년 06월) 수록논문
최근 권호 논문
| | | |

KCI등재

1특별기고: 국내 통계학계에 기여한 김준보 선생의 업적과 시사점

저자 : 최종후 ( Jong Hoo Choi )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 3호 발행 연도 : 2020 페이지 : pp. 229-238 (10 pages)

다운로드

(기관인증 필요)

초록보기

국내 대학에 '통계학과'가 최초로 개설된 해는 1962년이니 국내 대학에 통계학이 독자적인 학문 영역으로 자리 잡은지 어언 57년이 지났다. 김준보 선생은 국내 대학 최초 통계학과인 고려대 통계학과에 처음으로 부임한 전임 교원으로 이 땅 통계학 여명기에 통계학 교재 저술에 힘썼으며, 또한 1971년 한국통계학회 창설을 주도하고 초대 회장을 맡아 국내에 통계학이 독자적 학문영역으로 자리매김 할 수 있는 초석을 마련하셨다. 본고에서는 두 가지 논의를 중심으로 연구한다. 하나는 한국통계학회 태동과 김준보 선생, 다른 하나는 이 땅 통계학 여명기에 선생이 저술한 통계학 분야 두 권의 책을 개관한다. 『현대통계학 : 통계와 추계의 종합체계』(Kim, 1954), 『추측통계 : 표본조사와 실험계획법 입문』(Kim, 1956)이 그것이다.


The very first statistics department in Korean universities was founded in 1962, meaning it has been 57 years since Korean academia has regarded statistics as a wholly independent field of study. Dr. Junbo Kim was the first faculty member hired by Korea University's statistics department. He made a seminal contribution to the development and publication of statistics textbooks in those early years, and in 1971, spearheaded the efforts to found the Korean Statistical Society, serving as its first president. Naturally, Dr. Kim's significant contributions have laid the cornerstones for the advancement of statistics as an independent field of study in Korea. In this paper, I will explore two main subjects: one is the early history of the Korean Statistical Society with a special emphasis on Dr. Kim's contributions, and the other is an analytical overview his publications. Specifically, I will focus on Modern Statistics: A Synthesis of Statistics and Estimates』(Kim, 1954), and『Inferential Statistics: An Introduction to Sample Survey and Experimental Design』(Kim, 1956).

KCI등재

2건강수준의 측정 및 평점화 모형의 설계

저자 : 오필재 ( Piljae Oh ) , 김현철 ( Hyeoncheol Kim ) , 권혁성 ( Hyuksung Kwon )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 3호 발행 연도 : 2020 페이지 : pp. 239-256 (18 pages)

다운로드

(기관인증 필요)

초록보기

최근 기대수명의 증가로 건강에 대한 관심이 늘어나고 있으며 이에 따라 건강관련 산업 및 서비스에 대한 수요도 증가하고 있다. 개인의 건강상태를 다양한 요소들을 이용하여 평가하고 분류할 수 있는 방법을 통해 다양한 건강관련 프로그램 및 서비스를 보다 합리적으로 운영할 수 있을 것이다. 본 연구에서는 기존 연구를 통해 잘 알려진 건강상태 관련 요인들을 이용하여 건강수준을 측정하고 평점화하는 방안을 제시하였다. 이를 위해 신용평가모형의 변수 선정과 범주화, 모형 도출, 평점화로 이어지는 일련의 과정에서 사용하는 방법론을 도입하였고 모형의 적합을 위해서 국민건강보험공단에서 제공하는 표본 코호트 DB를 이용하였다. 본 연구에서 도출된 건강수준 평가모형은 헬스케어 및 건강관련 서비스에 대한 구조 설계 및 운영에 적절하게 활용될 수 있을 것으로 기대된다.


Health is an important issue due to increased life expectancy. As a result, the demand for industry and services associated with individual health, health-related programs and services will be facilitated by a method to evaluate and classify the health level of an individual based on various factors. This study suggests a methodology to measure and score an individual health level. A credit scoring model was introduced to implement the categorization of variables, construct a prediction model, and to score individual health level. Cohort DB provided by National Health Insurance Service was used to illustrate overall procedures. It is expected that the suggested model can be utilized in designing and managing health care services as well as other health-related programs.

KCI등재

3다변량 지수평활모형을 이용한 환율 분석

저자 : 이연하 ( Yeonha Lee ) , 성병찬 ( Byeongchan Seong )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 3호 발행 연도 : 2020 페이지 : pp. 257-267 (11 pages)

다운로드

(기관인증 필요)

초록보기

본 논문은 단변량 지수평활법의 확장된 형태인 다변량 지수평활법을 소개하고 다변량 시계열 분석에 활용한다. 다변량 지수평활법은 한 개의 오차를 기반으로 하는 상태공간모형을 이용하여 추정의 편리성을 제고하며, 다변량 시계열간의 잠재적인 상호연관성을 활용하여 적합도 및 예측력을 향상시킨다. 다변량 지수평활법의 성능을 평가하기 위하여 월별 원/달러 및 원/파운드 환율자료를 분석하고 예측한다. 대안 모형의 예측 결과와 비교하여 다변량 지수평활법의 우수성을 확인한다.


We introduce multivariate exponential smoothing models based on a vector innovations structural time series framework. The models enable us to exploit potential inter-series dependencies to improve the fit and forecasts of multivariate (vector) time series. Models are applied to forecast the exchange rates of the UK pound (UKP) and US dollar (USD) against the Korean won (KRW) observed on monthly basis; subseqently, we compare their performance with alternative models. We observe that the multivariate exponential smoothing models are superior to alternatives.

KCI등재

4시간경로 유전자 발현자료에서 패턴일치지수와 적응 최근접 이웃을 활용한 결측값 대치법

저자 : 신혜서 ( Heyseo Shin ) , 김동재 ( Dongjae Kim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 3호 발행 연도 : 2020 페이지 : pp. 269-280 (12 pages)

다운로드

(기관인증 필요)

초록보기

시간경로 유전자 발현 자료는 마이크로어레이 실험을 시간에 따라 관측한 대용량의 자료로 유전자 발현 수준을 동시에 파악할 수 있다. 하지만 실험 과정이 복잡하여 다양한 원인들에 의해 결측값이 자주 발생한다. 본 논문에서는 시간경로 유전자 발현 자료에 대한 결측값을 추정하는 방법으로 패턴 적응 최근접 이웃(pattern consistency index adaptive nearest neighbors; PANN) 방법을 제안하였다. 이 방법은 국소적 특징을 반영하는 적응 최근접 이웃(adaptive nearest neighbors; ANN) 방법과 관측 시점간 유전자 발현의 일치 정도를 고려하는 패턴일치지수를 결합시킨 것이다. 제안한 PANN 방법의 효능을 평가하기 위하여 두 가지의 실제 시간경로 자료들을 사용하여 몬테카를로 모의실험(Monte Carlo simulation study)을 시행하였다.


Time course gene expression data is a large amount of data observed over time in microarray experiments. This data can also simultaneously identify the level of gene expression. However, the experiment process is complex, resulting in frequent missing values due to various causes. In this paper, we propose a pattern consistency index adaptive nearest neighbors as a method of missing value imputation. This method combines the adaptive nearest neighbors (ANN) method that reflects local characteristics and the pattern consistency index that considers consistent degree for gene expression between observations over time points. We conducted a Monte Carlo simulation study to evaluate the usefulness of proposed the pattern consistency index adaptive nearest neighbors (PANN) method for two yeast time course data.

KCI등재

5다변량 경시적 자료 분석을 위한 공분산 행렬의 모형화 비교 연구

저자 : 곽나영 ( Na Young Kwak ) , 이근백 ( Keunbaik Lee )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 3호 발행 연도 : 2020 페이지 : pp. 281-296 (16 pages)

다운로드

(기관인증 필요)

초록보기

같은 개체로부터 반복 측정한 자료를 경시적 자료(longitudinal data)라고 한다. 이러한 자료를 분석하려면 흔히 사용되는 횡단 자료 분석과는 다른 분석 방법이 필요하다. 즉, 경시적 자료에서 공변량의 효과를 추정할 때에는 반복 측정된 결과 간의 상관성을 고려해야 하며, 따라서 공분산행렬을 모형화 하는 것이 매우 중요하다. 그러나 추정해야 할 모수가 많고, 추정된 공분산행렬이 양정치성을 만족해야 하므로 공분산 행렬의 모형화는 쉽지 않다. 특히 다변량 경시적 자료분석을 위한 공분산행렬의 모형화는 더욱더 심층적인 방법론을 사용해야 한다. 본 논문은 다변량 경시적 자료분석을 위한 공분산행렬을 모형화하기 위해 두 가지 방법론을 고찰한다. 두 방법 모두 수정된 콜레스키 분해(modified Cholesky decomposition)를 이용하여 시간에 따른 응답변수들의 상관관계를 설명하고 있다. 하지만 같은 시간에서 관측된 응답변수들간의 상관관계를 설명하는 방법이 다르다. 첫 번째 방법론에서는 향상된 선형 공분산 모형(enhanced linear covariance models)을 사용하여 공분산행렬이 양정치성을 만족하도록 한다. 두 번째 방법론에서는 분산-공분산 분해(variance-correlation decomposition)와 초구분해(hypersphere decomposition)을 이용하여 공분산 행렬을 모형화 한다. 이 두 방법론의 성능을 비교하고자 모의실험을 진행한다.


Repeated outcomes from the same subjects are referred to as longitudinal data. Analysis of the data requires different methods unlike cross-sectional data analysis. It is important to model the covariance matrix because the correlation between the repeated outcomes must be considered when estimating the effects of covariates on the mean response. However, the modeling of the covariance matrix is tricky because there are many parameters to be estimated, and the estimated covariance matrix should be positive definite. In this paper, we consider analysis of multivariate longitudinal data via two modeling methodologies for the covariance matrix for multivariate longitudinal data. Both methods describe serial correlations of multivariate longitudinal outcomes using a modified Cholesky decomposition. However, the two methods consider different decompositions to explain the correlation between simultaneous responses. The first method uses enhanced linear covariance models so that the covariance matrix satisfies a positive definiteness condition; in addition, and principal component analysis and maximization-minimization algorithm (MM algorithm) were used to estimate model parameters. The second method considers variance-correlation decomposition and hypersphere decomposition to model covariance matrix. Simulations are used to compare the performance of the two methodologies.

KCI등재

6함수형 ARCH 분석 및 다변량 변동성을 통한 일중 로그 수익률 시간 간격 선택

저자 : 김다희 ( D. H. Kim ) , 윤재은 ( J. E. Yoon ) , 황선영 ( S. Y. Hwang )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 3호 발행 연도 : 2020 페이지 : pp. 297-308 (12 pages)

다운로드

(기관인증 필요)

초록보기

본 논문에서는 고빈도 함수적 ARCH 모형을 소개하고 근사모형으로써 다변량 변동성 모형을 고려하였다. 이를 기반으로 함수형 변동성 분석에서 중요한 요소인 일중 로그 수익률의 적절한 시간 간격을 찾아보았다. 또한 함수적 ARCH 모형에서 l-시차 후 변동성 예측식을 제시하고 고빈도 KOSPI 자료에 적합하여 예시하였다.


We focus on the functional autoregressive conditional heteroscedasticity (fARCH) modelling to analyze intraday volatilities based on high frequency _nancial time series. Multivariate volatility models are investigated to approximate fARCH(1). A formula of multi-step ahead volatilities for fARCH(1) model is derived. As an application, in implementing fARCH(1), a choice of appropriate time interval for the intraday return is discussed. High frequency KOSPI data analysis is conducted to illustrate the main contributions of the article.

KCI등재

7이산형 자료 예측을 위한 베이지안 네트워크 분류분석기의 성능 비교

저자 : 박현재 ( Hyeonjae Park ) , 황범석 ( Beom Seuk Hwang )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 3호 발행 연도 : 2020 페이지 : pp. 309-320 (12 pages)

다운로드

(기관인증 필요)

초록보기

방향성 비순환 그래프(directed acyclic graph; DAG)라고도 하는 베이지안 네트워크(Bayesian network)는 변수 사이의 관계를 확률과 그래프를 통해 모형화할 수 있다는 점에서 최근 의학, 기상학, 유전학 등 여러 분야에서 다양하게 활용되고 있다. 특히 이산형 자료의 예측에 사용되는 베이지안 네트워크 분류분석기(Bayesian network classifier)가 최근 새로운 데이터 마이닝 기법으로 주목받고 있다. 베이지안 네트워크는 그 구조와 학습 방법에 따라 여러 가지 다양한 모형으로 분류할 수 있다. 본 논문에서는 서로 다른 성질을 가진 이산형 자료를 바탕으로 구조학습 방법에 차이를 두어 베이지안 네트워크 모형을 학습시킨 후, 가장 간단한 방법인 나이브 베이즈 (na¨ıve Bayes)모형과 비교해 본다. 학습된 모형들을 여러 가지 실제 데이터에 적용하여 그 예측 정확도를 비교함으로써 최적의 분류 분석 결과를 얻을 수 있는지 살펴본다. 또한 각각의 모형에서 나타나는 그래프를 통해 데이터의 변수 사이의 관계를 비교한다.


Bayesian networks, also known as directed acyclic graphs (DAG), are used in many areas of medicine, meteorology, and genetics because relationships between variables can be modeled with graphs and probabilities. In particular, Bayesian network classifiers, which are used to predict discrete data, have recently become a new method of data mining. Bayesian networks can be grouped into different models that depend on structured learning methods. In this study, Bayesian network models are learned with various properties of structure learning. The models are compared to the simplest method, the na¨ıve Bayes model. Classification results are compared by applying learned models to various real data. This study also compares the relationships between variables in the data through graphs that appear in each model.

KCI등재

8미 연준 통화정책방향 의결문의 시그널링 효과 분석

저자 : 우신욱 ( Shinwook Woo ) , 장영재 ( Youngjae Chang )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 3호 발행 연도 : 2020 페이지 : pp. 321-334 (14 pages)

다운로드

(기관인증 필요)

초록보기

최근 미 연준이 정책금리 인하를 결정하면서 향후 통화정책 운용방향에 관해 관심이 고조되고 있다. 과거 금리동결 시점이나 동결기간 중, 그리고 인상이나 인하 시점이 다가왔을 때 통화정책 의결문의 표현을 살펴보면 단어 선택의 변화 등을 통해 시장과 꾸준하게 커뮤니케이션해 왔었다는 것을 알 수 있다. 하지만 이렇게 의결문의 표현을 문맥을 통해 분석하는 방법이 다소 주관적이고 정성적인 분석에 그칠 수 있다는 비판이 있다. 이런 점을 고려하여 Woo와 Chang (2016)에서는 데이터마이닝 기법 중 하나인 텍스트마이닝 방법을 통해 의결문 분석 과정을 보완할 수 있는 방법을 제안한 바 있다. 본 논문에서는 선행 연구 결과를 토대로 미 연준의 통화정책 의결문의 정책 시그널링 효과를 평가해 보았다. 의결문의 특성을 텍스트마이닝 관점에서 분석하고 의결문 간 표현의 변화를 포착하여 향후 정책기조 변화를 예측하고자 하였다. 이를 위해 대표적인 데이터마이닝 기법인 의사결정나무모형과 신경망모형을 사용하였다. 분석 결과, 대체로 의결문 간 비유사성의 변화가 향후 정책 변화를 효과적으로 예측할 수 있는 것으로 평가되었으며, 그동안 미 연준이 의결문을 통해 체계적으로 정책 시그널링을 실시해 온 결과로 판단할 수 있다.


The US Federal Reserve (Fed) has decided to cut interest rates. When we look at the expression of the FOMC statements at the time of policy change period we can understand that Fed has been communicating with markets through a change of word selection. However, there is a criticism that the method of analyzing the expression of the decision sentence through the context can be subjective and limited in qualitative analysis. In this paper, we evaluate the signaling effect of FOMC statements based on previous research. We analyze decision making characteristics from the viewpoint of text mining and try to predict future policy trend changes by capturing changes in expressions between statements. For this purpose, a decision tree and neural network models are used. As a result of the analysis, it can be judged that the discrepancy indicators between statements could be used to predict the policy change in the future and that the US Federal Reserve has systematically implemented policy signaling through the policy statements.

KCI등재

9란체스터 모형에 대한 통계적 고찰과 해석

저자 : 유병주 ( Byung Joo Yoo )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 3호 발행 연도 : 2020 페이지 : pp. 335-345 (11 pages)

다운로드

(기관인증 필요)

초록보기

본 논문에서는 과거 2차 세계대전 자료 중 Ardennes 전역에서 있었던 실제 전투 자료를 란체스터 모형에 적합 시키기 위하여 로그변환된 선형회귀모형을 추정하는 문제를 다루었다. 먼저 동일한 자료에 대하여 기존 연구 결과를 고찰하여 모수에 대한 최적해(Global Solution) 결정 문제와 다중공선성 문제들을 확인하였다. 최소제곱 추정법에 의한 모수 추정은 특정 제약조건이나 제한된 후보군을 고려할 경우 최적해를 찾지 못하고 지역해(Local Solution)를 찾을 수 있음으로 주의가 필요하고, 모형에 포함된 변수들은 통계적으로 충분히 유의성을 검토하여 포함해야지 그렇지 않았을 때 모수 추정값들이 왜곡될 수 있다. 모형에 과도하게 많은 설명 변수를 포함하는 경우 변수 간의 상관관계로 인하여 추정값이 왜곡되고 변수의 추가나 제거 시 불안정한 현상들이 발생한다. 이런 다중공선성 문제를 탐색하는 방법은 설명 변수 간의 선형적 연관 관계를 측정할 수 있는 분산확대인자(VIF)로 알려진 통계량에 의해 확인이 가능하며 이를 조치하기 위해서는 상호 연관된 설명 변수들을 제거하여 모형을 단순화해야 한다. 그래서 이러한 문제가 발생하지 않도록 모형을 단순화하고 이해와 설명이 용이한 전투력 손실률 모형을 제안하였고 Ardennes 자료에 대하여 적합한 결과 모수 추정이 안정적이고 자료에 대한 설명과 해석이 용이하다는 점을 입증하였다. 특히, 모수 추정간 선형회귀 모형의 기본적인 가정사항인 독립성, 정규성, 등분산성을 검증하여 자기상관(Autocorrelation) 문제로 독립성이 훼손되어 과대 과소 추정될 우려가 있는 사항을 Cochrane-Orcutt 방법에 의해 변환하여 독립성과 정규성을 보장하였다.


This paper deals with the problem of estimating the log-transformed linear regression model to fit actual battle data from the Ardennes Campaign of World War II into the Lanchester model. The problem of determining a global solution for parameters and multicollinearity problems are identified and modified by examining the results of previous studies on data. The least squares method requires attention because a local solution can be found rather than a global solution if considering a specific constraint or a limited candidate group. The method of exploring this multicollinearity problem can be confirmed by a statistic known as a variance inflation factor. Therefore, the Lanchester model is simplified to avoid these problems, and the combat power attrition rate model was proposed which is statistically significant and easy to explain. When fitting the model, the dependence problem between the data has occurred due to autocorrelation. Matters that might be underestimated or overestimated were resolved by the Cochrane-Orcutt method as well as guaranteeing independence and normality.

KCI등재

10집단 크기 추정에 대한 미표본 집단의 영향

저자 : 정유진 ( Yujin Chung )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 3호 발행 연도 : 2020 페이지 : pp. 348-356 (9 pages)

다운로드

(기관인증 필요)

초록보기

IM 모형(Isolation-with-Migration model; IM model)은 현존하는 집단들의 크기, 그 집단들이 공통 조상 집단으로부터 분리 된 분화 시간, 그리고 현존 집단 간의 이주율을 추정하는 데 널리 사용되는 진화 모형이다. IM 모형과 같은 진화 모형은 그 진화 모형 내 현존 집단으로부터 추출 된 DNA 염기서열을 분석하여 추정할 수 있다. 참인 진화 모형이 데이터가 추출되지 않은 미표본 집단(unsampled population) 혹은 소위 ghost라 불리는 집단을 포함할때, 종종 이 미표본 집단을 제외한 진화 모델이 추론된다. 본 논문에서는 미표본 집단이 표본집단의 크기 추정에 미치는 영향을 조사하기 위해 모의실험을 수행하였다. 표본집단과 미표본집단 사이에 이주 사건들이 존재하는 경우, 표본집단의 크기의 추정량은 편향되었다. 그러나 미표본집단을 포함한 진화 모델이 추정되면 표본집단의 크기의 추정량은 많은 경우 개선되었다.


An Isolation-with-Migration (IM) model is used to estimate extant population sizes, the splitting time of populations split away from their common ancestral populations, and migration rates between the extant populations. An evolutionary model such as IM models is estimated by analyzing DNA sequences sampled from the extant populations in the model. When a true model includes an unsampled 'ghost' population without data, the unsampled population is often ignored from the evolutionary model to infer. In this paper, we conduct a simulation study to investigate the effect of an unsampled population on the estimation of the size of the sampled population. When there exists an unsampled population that shares migrations with the sampled population, the size estimation of the sampled population was biased. However, the size estimation was improved if an evolutionary model, including the unsampled population, was estimated.

1
권호별 보기
가장 많이 인용된 논문

(자료제공: 네이버학술정보)

가장 많이 인용된 논문
| | | |
1연안해역에서 석유오염물질의 세균학적 분해에 관한 연구

(2006)홍길동 외 1명심리학41회 피인용

다운로드

2미국의 비트코인 규제

(2006)홍길동심리학41회 피인용

다운로드

가장 많이 참고한 논문

(자료제공: 네이버학술정보)

가장 많이 참고한 논문

다운로드

2미국의 비트코인 규제

(2006)홍길동41회 피인용

다운로드

해당 간행물 관심 구독기관

조선대학교 고려대학교 성균관대학교 부산연구원 서울대학교
 158
 117
 82
 65
 53
  • 1 조선대학교 (158건)
  • 2 고려대학교 (117건)
  • 3 성균관대학교 (82건)
  • 4 부산연구원 (65건)
  • 5 서울대학교 (53건)
  • 6 연세대학교 (46건)
  • 7 이화여자대학교 (37건)
  • 8 경희대학교 (32건)
  • 9 국회도서관 (27건)
  • 10 중앙대학교(서울) (25건)

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기