간행물

한국통계학회> 응용통계연구

응용통계연구 update

The Korean Journal of Applied Statistics

  • : 한국통계학회
  • : 자연과학분야  >  통계학
  • : KCI등재
  • :
  • : 연속간행물
  • : 격월
  • : 1225-066x
  • : 2383-5818
  • :

수록정보
수록범위 : 1권1호(1987)~33권4호(2020) |수록논문 수 : 1,892
응용통계연구
33권4호(2020년 08월) 수록논문
최근 권호 논문
| | | |

KCI등재

1기하평균에 대한 소고

저자 : 여인권 ( In-kwon Yeo )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 4호 발행 연도 : 2020 페이지 : pp. 357-364 (8 pages)

다운로드

(기관인증 필요)

초록보기

이 소고에서는 기하평균의 성질과 기하평균과 관련된 통계적 추론에 대한 알아 본다. 로그변환-역변환을 통해 얻어진 통계적 추론 결과가 기하평균과 관련이 있다는 것을 보이고 이 과정에서 유도된 결과를 어떻게 해석해야 하는지를 설명한다.


We review the characteristics of a geometric mean and statistical inferences based on geometric means. We also show that the statistical results obtained by the logarithmic transform and back-transformation are related to geometric means and explain how to interpret the results produced in this process.

KCI등재

2내재된 인자회귀모형의 베이지안 분석법

저자 : 경민정 ( Minjung Kyung )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 4호 발행 연도 : 2020 페이지 : pp. 365-377 (13 pages)

다운로드

(기관인증 필요)

초록보기

선형모형에서 두개 이상의 설명변수들 사이에 존재하는 다중공선성 문제를 변수들 간에 내재되어 있는 공통의 구조인 인자를 구성하고, 인자들을 회귀변수로 사용하여 해결하는 인자회귀모형에 대하여 논의한다. 무한개로 가정 가능한 내재된 인자 중 유의미한 인자적재행렬을 구성하기 위하여 벌점모수의 값이 큰 LASSO 사전분포를 적용하는 베이지안 추정법을 사용한다. 결정된 인자적재행렬과 다른 모수들의 추정값을 각 설명변수의 선형모수로 역변환 하여, 새로운 관측값에 대한 예측 모형으로도 사용한다. 제안한 방법을 제품 서비스 관리 자료에 적용하여 정해진 인자의 개수에 대한 인자가 일반적인 공통인자회귀모형과 동일한 결과를 나타냄을 확인하였고, 일반적인 공통인자회귀모형과 비교를 위해 계산한 평균 제곱 오차값이 더 작다는 것을 알 수 있었다.


We discuss latent factor regression when constructing a common structure inherent among explanatory variables to solve multicollinearity and use them as regressors to construct a linear model of a response variable. Bayesian estimation with LASSO prior of a large penalty parameter to construct a significant factor loading matrix of intrinsic interests among infinite latent structures. The estimated factor loading matrix with estimated other parameters can be inversely transformed into linear parameters of each explanatory variable and used as prediction models for new observations. We apply the proposed method to Product Service Management data of HBAT and observe that the proposed method constructs the same factors of general common factor analysis for the fixed number of factors. The calculated MSE of predicted values of Bayesian latent factor regression model is also smaller than the common factor regression model.

KCI등재

3의료, 보건, 역학 분야에서 생산되는 준경쟁적 위험자료를 분석하기 위한 통계적 모형의 개발과 임상분석시스템 구축을 위한 연구

저자 : 김진흠 ( Jinheum Kim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 4호 발행 연도 : 2020 페이지 : pp. 379-393 (15 pages)

다운로드

(기관인증 필요)

초록보기

사망과 같은 종말 사건은 중간 사건을 중도절단 시킬 수 있지만 재발과 같은 중간 사건은 종말 사건을 중도절단 시킬 수 없는 자료를 준경쟁위험 자료라고 하는데 의학 및 보건, 역학 분야에서는 이와 같은 자료를 자주 접하게 된다. 본 논문에서는 질병-사망 모형에 포함된 세 가지 전이 시간이 모두 구간중도절단된 준경쟁위험 자료를 분석하기 위해 정규 프레일티를 가진 와이블 회귀모형을 제안하였다. 각 개체는 중간 사건과 종말 사건의 발생 여부에 따라 다섯 가지 유형으로 구분되는데 유형별로 조건부 우도함수를 유도하였다. 조정중요표본추출법을 써서 주변 우도함수를 유도한 후 반복의사뉴톤 알고리즘을 써서 최적 추정량을 얻었다. 제안한 추정 방법의 소표본 성질을 살펴보기 위해 모의실험을 수행하였으며 또한 제안한 추정 방법을 Personnes Ag´ees Quid (PAQUID) 자료에 적용하였다.


A terminal event such as death may censor an intermediate event such as relapse, but not vice versa in semicompeting risks data, which is often seen in medicine, public health, and epidemiology. We propose a Weibull regression model with a normal frailty to analyze semi-competing risks data when all three transition times of the illness-death model are possibly interval-censored. We construct the conditional likelihood separately depending on the types of subjects: still alive with or without the intermediate event, dead with or without the intermediate event, and dead with the intermediate event missing. Optimal parameter estimates are obtained from the iterative quasi-Newton algorithm after the marginalization of the full likelihood using the adaptive importance sampling. We illustrate the proposed method with extensive simulation studies and PAQUID (Personnes Ag´ees Quid) data.

KCI등재

4Index of Union와 다른 정확도 측도들

저자 : 홍종선 ( Chong Sun Hong ) , 최소연 ( So Yeon Choi ) , 임동휘 ( Dong Hui Lim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 4호 발행 연도 : 2020 페이지 : pp. 395-407 (13 pages)

다운로드

(기관인증 필요)

초록보기

최적분류점에 대한 대부분의 정확도 측도들은 두 종류의 누적분포함수와 확률밀도함수를 기반으로 정의하거나 또는 ROC 곡선과 AUC를 기반으로 정의하는 방법으로 구분하는데, Unal (2017)은 두 가지 방법을 혼합하여 누적분포함수와 AUC를 모두 고려하는 정확도 측도 Index of Union (IU) 통계량을 제안하였다. 본 연구에서는 IU 통계량을 포함한 열 개의 정확도 측도들을 여섯 종류의 범주로 구분하여 각 범주에 속하는 측도들을 비교하면서 IU의 장점을 연구한다. 다양한 정규혼합분포를 설정하여 각각의 측도들에 대응하는 최적분류점들을 구하고 각 분류점에 대응하는 제1종과 제2종 오류 그리고 두 종류의 오류합을 구해서 오류들의 크기를 비교하면서 분류정확도 측도들의 판별력을 비교하면서 IU의 성격과 특징을 탐색한다. 두 종류 분포들의 평균 차이가 증가할수록 IU 통계량의 제1종 오류와 오류합의 크기가 최고의 분류정확도를 갖는 제2범주의 정확도 측도의 오류에 수렴하는 것을 발견하였다. 그러므로 IU는 모형의 판별력을 평가하는 정확도 측도로 활용할 수 있다.


Most classification accuracy measures for optimal threshold are divided into two types: one is expressed with cumulative distribution functions and probability density functions, the other is based on ROC curve and AUC. Unal (2017) proposed the index of union (IU) as an accuracy measure that considers two types to get them. In this study, ten kinds of accuracy measures (including IU) are divided into six categories, and the advantages of the IU are studied by comparing the measures belonging to each category. The optimal thresholds of these measures are obtained by setting various normal mixture distributions; subsequently, the first and second type of errors as well as the error sums corresponding to each threshold are calculated. The properties and characteristics of the IU statistic are explored by comparing the discriminative power of other accuracy measures based on error values.The values of the first type error and error sum of IU statistic converge to those of the best accuracy measures of the second category as the mean difference between the two distributions increases. Therefore, IU could be an accuracy measure to evaluate the discriminant power of a model.

KCI등재

5전수층 무응답 편향보정 추정법에 관한 연구

저자 : 정희영 ( Hee Young Chung ) , 신기일 ( Key-il Shin )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 4호 발행 연도 : 2020 페이지 : pp. 409-420 (12 pages)

다운로드

(기관인증 필요)

초록보기

사업체조사에서는 흔히 수정절사법이 사용되며 이 방법을 사용함으로써 표본의 수를 줄이면서도 추정의 정확성을 향상 시킬 수 있다. 그러나 전수층의 무응답률은 크게 높아지고 있으며 예비표본을 이용한 표본대체가 불가능하기 때문에 전수층에서 발생한 무응답은 추정의 정확성을 크게 떨어뜨리고 있다. 특히 무응답이 관심변수에 영향을 받는 경우에는 편향이 발생할 가능성이 매우 높기 때문에 이를 적절히 처리하는 것은 매우 중요하다. 본 연구에서는 전수층에서 발생한 무응답을 적절히 처리하는 방법의 하나로 편향보정 추정법을 제안하였다. 특히 Chung과 Shin(2020)에서 제안한 편향보정 추정량을 전수층 편향보정에 적용하였으며 전수층이라는 특수한 경우에 맞는 새로운 추정 방법을 제안하였다. 또한 모의실험을 통해 제안된 방법의 우수성을 살펴보았으며 실제 자료 분석을 실시하여 본 논문에서 제안한 방법의 우수성을 확인하였다.


In business survey, modified cut-off sampling is commonly used to greatly increase the accuracy of the estimation while reducing the number of samples. However, non-response rate of take-all stratum has increased significantly and the sample substitution is not possible because the non-response in the take-all stratum affects the accuracy of the estimation. It is important to adjust the bias appropriately if non-response is affected by the variable of interest. In this study, a bias adjusted estimation is proposed as an appropriate method to deal with a non-response in the take-all stratum. In particular, the estimator proposed by Chung and Shin (2020) was applied to the bias adjustment for the take-all stratum; therefore, we suggest a new method to adjust properly for the take-all stratum. The superiority of the proposed estimator was examined through simulation studies and confirmed through actual data analysis.

KCI등재

6R를 활용한 인구변동요인 산정과 인구추계 시스템

저자 : 오진호 ( Jinho Oh )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 4호 발행 연도 : 2020 페이지 : pp. 421-437 (17 pages)

다운로드

(기관인증 필요)

초록보기

본 논문은 최근에 널리 사용되고 있는 R 프로그램으로 출산율, 사망률, 국제이동률을 예측하고 이들 결과를 Leslie 행렬에 대입해 인구추계 산출하는 방법을 소개한다. 특히 Kaneko (2003)가 제안한 출산율의 일반화로그감마모형, Li 등 (2013)의 사망률 LC-ER 모형, Ramsay와 Silverman (2005)가 제안한 국제이동률의 함수적데이터모형을 시현할 수 있도록 하였다. 최근 R로 구현된 대표적인 인구추계 패키지로 demography, bayesPop가 소개되고 있으나, 이는 Human Mortality Database (HMD), Human Fertility Database (HFD)에 업로드된 자료에 한에서만 분석 이 가능하고 기타 데이터를 적용하기 위해서는 자료 변경과 수정이 요구된다. 특히 우리나라의 경우 HMD에 단기 간의 자료로만 제공되어 있어 이 패키기를 적용하기에는 한계점이 있다. 이에 본 논문은 이런 실정과 한국의 저출산, 고령화, 내국인, 외국인 국제이동률 상이패턴을 반영할 수 있는 R 프로그램을 소개하고, 2117년까지의 인구추계를 도출하였다.


This paper implemented a method to predict the fertility rate, mortality rate, and international migration rate using the R program, which has been widely used in recent years, that calculates population projection by substituting the results into the Leslie matrix. In particular, the generalization log gamma model for the fertility rate by Kaneko (2003), LC-ER model for mortality rate by Li et al. (2013), and functional data model for international migration rates proposed by Ramsay and Silverman (2005) and Hyndman and Booth (2008), Hyndman et al. (2013) can be directly demonstrated with R programs. Demography and bayesPop have been introduced as a representative demographic package implemented in R; however, it can be analyzed only for data uploaded to Human Mortality Database (HMD) and Human Fertility Database (HFD) with data changes and modifications requiring application of other data. In particular, in Korea, there is a limitation in applying this package because it is provided only for short-term data in HMD. This paper introduces an R program that can reflect this situation and the different patterns of low fertility, aging, migration of domestic and foreigners in Korea, and derives a population projection for the year 2117.

KCI등재

7메타분석의 선택 편향 보정을 위한 쌍별 유사가능도 접근법

저자 : 국성희 ( Sunghee Kuk ) , 이우주 ( Woojoo Lee )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 4호 발행 연도 : 2020 페이지 : pp. 439-449 (11 pages)

다운로드

(기관인증 필요)

초록보기

메타 분석은 여러 연구 결과들을 종합시켜주는 분석 방법 중 하나이다. 이 때 수집되는 연구 문헌들은 소규모 연구인 경우 통계적으로 유의한 결과를 보이는 연구가 출간될 확률이 높기 때문에, 선택 편향의 특수한 경우인 출판 편향이 종종 발생한다. 선택 편향을 보정하는 방법에는 조건부 가능도와 가중 추정 방정식이 있는데 이 방법들은 실제얻기 힘든 정확한 선택 확률 모형을 필요로한다. 반면 쌍별 유사가능도 접근법은 선택 확률 모형을 정확히 알 수 없는 경우에도 선택 편향을 보정할 수 있는 방법으로 제안되었다. 본 논문은 메타분석에서 쌍별 유사가능도 접근법의 성능과 문제점을 수치적으로 연구한다.


Meta-analysis provides a way of integrating several independent studies of interest. Since small studies with statistically significant results are more likely to be published, publication bias, which is a special case of selection bias, often occurs in meta analysis. Conditional likelihood and weighted estimating equation have been proposed to deal with publication bias, but they require to specify a correct selection probability model. In contrast, the pairwise pseudolikelihood approach can correct publication bias without fully specifying the correct selection probability model, but its performance in meta-analysis was not investigated. In this paper, we perform a numerical study about whether the pairwise pseudolikelihood approach is effective for solving publication bias arising from typical meta-analysis settings.

KCI등재

8붓스트랩에 기초하여 조정한 관리한계를 사용하는 CCC-r 관리도의 성능

저자 : 김민지 ( Minji Kim ) , 이재헌 ( Jaeheon Lee )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 4호 발행 연도 : 2020 페이지 : pp. 451-466 (16 pages)

다운로드

(기관인증 필요)

초록보기

CCC-r 관리도는 불량률이 매우 낮은 고품질 공정을 관리하는 데 효율적이라고 알려져 있다. 대부분의 공정에서 공정 모수의 값은 알려져 있지 않기 때문에 제1국면에서 이를 추정해야 하는데, 표본의 크기가 충분히 크지 않은 경우 추정 오차가 발생하여 원하는 관리상태에서의 성능을 만족하지 못하는 경우가 발생한다. 뿐만 아니라 제1국면에서 추출하는 표본에 따른 산포로 인하여 관리상태일 때의 성능의 산포 또한 커지게 된다. 이러한 문제를 해결하기 위해 이 논문에서는 관리상태일 때 신호까지의 평균관측개수가 사전에 정한 확률로 목표하는 값보다 큰 값을 갖도록, 붓스트랩 알고리즘을 사용하여 CCC-r 관리도의 관리한계를 조정하는 절차를 제안하였다. 이때 고품질 공정에 적용하기 위하여 최대우도추정량 대신 베이즈추정량을 사용하여 불량률을 추정하였다. 다양한 상황에 대해 모의실험을 수행한 결과, 제안된 절차는 CCC-r 관리도의 관리상태 성능을 크게 향상시킴을 알 수 있었다.


CCC-r chart is effective for high-quality processes with a very low fraction nonconforming. The values of process parameters should be estimated from the Phase I sample since they are often not known. However, if the Phase I sample size is not sufficiently large, an estimation error may occur when the parameter is estimated and the practitioner may not achieve the desired in-control performance. Therefore, we adjust the control limits of CCC-r charts using the bootstrap algorithm to improve the in-control performance of charts with smaller sample sizes. The simulation results show that the adjustment with the bootstrap algorithm improves the in-control performance of CCC-r charts by controlling the probability that the in-control average number of observations to signal (ANOS) has a value greater than the desired one.

KCI등재

9이분산 시계열 모형에서 모수의 변화에 대한 모니터링 절차의 점근 성질

저자 : 김수택 ( Soo Taek Kim ) , 오해준 ( Hae June Oh )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 4호 발행 연도 : 2020 페이지 : pp. 467-482 (16 pages)

다운로드

(기관인증 필요)

초록보기

본 논문은 이분산성을 갖는 위치-척도 시계열 모형에서 모수의 변화에 대한 모니터링 절차를 연구한다. 모니터링 절차에서 수정된 잔차의 누적합을 이용한 탐지기를 소개하고 귀무가설과 대립가설 하에서 각각 모니터링 절차에 대한 점근적 성질을 규명한다. 그리고 모의실험과 사례 분석을 통하여 제안한 모니터링 방법의 성능이 우수함을 확인한다.


We investigate a monitoring procedure for the early detection of parameter changes in location-scale time series models. We introduce a detector for monitoring procedure based on modified residual cumulative sum (CUSUM). The asymptotic properties of the monitoring procedure are established under the null and alternative hypotheses. Simulation results and data analysis are also provided for illustration.

KCI등재

10산업군별 온라인 뉴스에 기초한 감성 예측변수를 포함하는 심층 신경망모형에 의한 주가 예측

저자 : 임준형 ( Jun Hyeong Lim ) , 손영숙 ( Young Sook Son )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 4호 발행 연도 : 2020 페이지 : pp. 483-497 (15 pages)

다운로드

(기관인증 필요)

초록보기

본 연구에서는 심층 신경망모형을 사용하여 KOSPI 100의 개별 종목인 기아차 및 신세계의 주가를 예측하였다. 예측변수로는 흔히 사용되었던 기술적 변수들과 함께 온라인 뉴스로부터 도출된 감성변수를 사용하였다. 특히 소셜 네트워크 분석을 활용하여 분류된 산업군에 특화된 감성사전을 구축한 후, 감성분석을 통하여 산업군에 속하는 각 기업들의 감성점수의 평균을 산업군 감성변수로 생성하였다. 여러 예측변수들의 조합으로 이루어진 모형들 중에서 기술적 변수와 산업군의 온라인 뉴스에 기초한 감성변수를 함께 사용하였을 때 우수한 예측력과 수익률을 보여주었다.


We used a deep neural network model for the prediction of the stock prices of Kia Motors and Shinsegae as listed in the KOSPI 100. We used an emotional variable derived from online news in addition to the various technical indicators most often used. The emotional variable used as a predictor variable was generated from the average of the emotional scores for companies in the industrial group after building an emotional dictionary specific to each industrial group classified in a social network analysis. The study was conducted with various combinations of predictors and confirmed that good predictive and profitable power could be expected when jointly using technical indicators and an emotional variable based on online news by industrial groups.

12
권호별 보기
가장 많이 인용된 논문

(자료제공: 네이버학술정보)

가장 많이 인용된 논문
| | | |
1연안해역에서 석유오염물질의 세균학적 분해에 관한 연구

(2006)홍길동 외 1명심리학41회 피인용

다운로드

2미국의 비트코인 규제

(2006)홍길동심리학41회 피인용

다운로드

가장 많이 참고한 논문

(자료제공: 네이버학술정보)

가장 많이 참고한 논문

다운로드

2미국의 비트코인 규제

(2006)홍길동41회 피인용

다운로드

해당 간행물 관심 구독기관

연세대학교 서울대학교 고려대학교 성균관대학교 한양대학교
 71
 67
 46
 43
 35
  • 1 연세대학교 (71건)
  • 2 서울대학교 (67건)
  • 3 고려대학교 (46건)
  • 4 성균관대학교 (43건)
  • 5 한양대학교 (35건)
  • 6 부산대학교 (30건)
  • 7 서울시립대학교 (27건)
  • 8 중앙대학교(서울) (25건)
  • 9 통계청 (19건)
  • 10 이화여자대학교 (18건)

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기