간행물

한국통계학회> 응용통계연구

응용통계연구 update

The Korean Journal of Applied Statistics

  • : 한국통계학회
  • : 자연과학분야  >  통계학
  • : KCI등재
  • :
  • : 연속간행물
  • : 격월
  • : 1225-066x
  • : 2383-5818
  • :

수록정보
34권1호(2021) |수록논문 수 : 8
간행물 제목
34권1호(2021년) 수록논문
권호별 수록 논문
| | | |

KCI등재

1표본조사에서 크론바흐알파값을 사용한 신뢰성

저자 : 박현아 ( Hyeonah Park )

발행기관 : 한국통계학회 간행물 : 응용통계연구 34권 1호 발행 연도 : 2021 페이지 : pp. 1-8 (8 pages)

다운로드

(기관인증 필요)

초록보기

사회조사에서 추상적 개념은 타당성과 신뢰성이 보장된 측정도구를 사용하여야 한다. 그와 같은 측정도구에 의해 도출된 관측점수는 타당한 관측점수와 편향된 관측점수와 오차로 나눌 수 있으며 편향된 값의 유무가 타당성과 연관되어 있으며 오차값의 유무가 신뢰성과 연관되어 있다. 측정도구가 타당도 및 신뢰도를 만족하는 지를 보기 위한 기법들이 많이 존재한다. 예를 들면 요인분석을 통한 구성타당도, 크론바흐 알파값에 의한 내적일치도 등을 들 수 있다. 본 연구에서 크론바흐알파값의 계산은 표본을 통해서 도출되는 데 복잡한 표본설계와 무응답이 발생했을 때 크론바흐알파값의 추정법에 대해 살펴본다. 제안된 기법에 대한 모의실험으로 다변량정규분포를 사용하여 기존의 여러 다른 크론바흐알파값의 추정기법과 비교분석한다.


Abstract concepts in social research must use measurement tools that are assured of validity and reliability. Observation score derived by a measurement tool can be divided into a valid observation score, a biased observation score, and an error. The presence or absence of a biased value is associated with validity, and the presence or absence of an error value is associated with reliability. There are many techniques for seeing whether a measurement tool is valid and reliable. For example, there are construct validity using factor analysis and internal consistency based on the Cronbach alpha. In this study, the calculation of the Cronbach alpha is derived through a sample, so we suggest an estimator of the Cronbach alpha under complex sample design and nonresponse. In a simulation, the proposed method is compared with many other existing estimators of Cronbach alpha under a multivariate normal distribution.

KCI등재

2약물동태학 모형에 대한 변분 베이즈 방법

저자 : 박선 ( Sun Park ) , 조성일 ( Seongil Jo ) , 이우주 ( Woojoo Lee )

발행기관 : 한국통계학회 간행물 : 응용통계연구 34권 1호 발행 연도 : 2021 페이지 : pp. 9-23 (15 pages)

다운로드

(기관인증 필요)

초록보기

본 논문에서는 평균장 방법(mean-field methods)을 기반으로 사후 분포(posterior distribution)를 근사하는 방법인 변분 베이즈 방법(variational Bayes methods)에 대해 소개한다. 특히, 모수들을 실수공간으로 변환 후의 결합 사후분포를 가우시안 분포(Gaussian distribution)들의 곱(product)으로 근사하는 방법인 자동 미분 변분 추론(automatic differentiation variational inference)방법에 대해 자세히 소개하고, 환자에게 약물을 투여한 후 시간에 따라 약물의 흐름을 파악하는 연구인 약물동태학 모형(pharmacokinetic models)에 적용한다. 소개된 변분 베이즈 방법을 이용하여 자료분석을 실시하고 마코프 체인 몬테 카를로(Markov chain Monte Carlo)방법을 기초로한 자료분석의 결과와 비교한다. 알고리즘의 구현은 Stan을 이용한다.


In the following paper we introduce a variational Bayes method that approximates posterior distributions with mean-field method. In particular, we introduce automatic differentiation variation inference (ADVI), which approximates joint posterior distributions using the product of Gaussian distributions after transforming parameters into real coordinate space, and then apply it to pharmacokinetic models that are models for the study of the time course of drug absorption, distribution, metabolism and excretion. We analyze real data sets using ADVI and compare the results with those based on Markov chain Monte Carlo. We implement the algorithms using Stan.

KCI등재

3동적 DCSBM을 모니터링하는 자기출발 절차

저자 : 이주원 ( Joo Weon Lee ) , 이재헌 ( Jaeheon Lee )

발행기관 : 한국통계학회 간행물 : 응용통계연구 34권 1호 발행 연도 : 2021 페이지 : pp. 25-38 (14 pages)

다운로드

(기관인증 필요)

초록보기

최근 동적 연결망의 비정상적 변화를 감시하기 위한 연결망 모니터링의 필요성이 높아지고 있다. 이 논문에서는 연결망의 구조적 변화를 감시하기 위한 동적 연결망의 모형으로 DCSBM(degree corrected stochastic block model)을 고려하였다. 관리도 절차를 사용하여 동적 연결망을 감시하려면 제1국면을 통해 초기 연결망을 확보한 후 모형의 모수를 추정하는 단계를 거쳐야 한다. 그러나 연결망의 감시에서는 충분한 수의 초기 연결망을 확보하기 어려운 경우가 대부분이다. 이 논문에서는 동적 DCSBM을 감시하기 위한 자기출발 관리도 절차를 제안한다. 이 절차는 모형의 모수 추정을 위해 확보한 연결망의 수가 아주 적은 경우에 유용하게 사용할 수 있는 절차이다. 모의실험을 통해 절차의 성능을 평가한 결과, 제안된 절차는 초기 연결망의 수가 아주 적은 경우에도 좋은 관리상태의 성능을 나타내는 것을 알 수 있었다.


Recently the need for network surveillance to detect abnormal behavior within dynamic social networks has increased. We consider a dynamic version of the degree corrected stochastic block model (DCSBM) to simulate dynamic social networks and to monitor for a significant structural change in these networks. To apply a control charting procedure to network surveillance, in-control model parameters must be estimated from the Phase I data, that is from historical data. In network surveillance, however, there are many situations where sufficient relevant historical data are unavailable. In this paper we propose a self-starting Shewhart control charting procedure for detecting change in the dynamic networks. This procedure can be a very useful option when we have only a few initial samples for parameter estimation. Simulation results show that the proposed procedure has good in-control performance even when the number of initial samples is very small.

KCI등재

4퍼터베이션 방법을 활용한 평균-숏폴 포트폴리오 최적화

저자 : 원하연 ( Hayeon Won ) , 박세영 ( Seyoung Park )

발행기관 : 한국통계학회 간행물 : 응용통계연구 34권 1호 발행 연도 : 2021 페이지 : pp. 39-68 (30 pages)

다운로드

(기관인증 필요)

초록보기

Markowitz (1952)의 분산투자 모형 발표 이후 포트폴리오 최적화에 대한 많은 연구가 이루어졌다. 마코위츠의 평균-분산 포트폴리오 최적화 모형은 수익 분포가 정규분포를 따른다는 가정하에서 성립한다. 그러나 실생활에서는 수익 분포가 정규분포를 따르지 않는 경우가 존재한다. 또한 분산은 이상치의 영향을 많이 받는 민감한 지표이다. 이런 분산의 단점을 보완할 수 있는 하방위험인 숏폴(Shortfall)을 위험 지표로 적용함으로써 수익 분포에 대해 최적화가 가능한 평균-숏폴 포트폴리오 모형이 제안되었다. 또한 Jorion (2003)과 Park (2019)은 포트폴리오의 위험도를 최소화하는 동시에 적은 수의 자산으로 구성(sparse)되고 안정적(stable)인 포트폴리오를 얻는 퍼터베이션 방법을 제안하였다. 본 논문에서는 평균-숏폴 포트폴리오 모형에 퍼터베이션 방법과 adaptive Lasso를 적용하여 사용되는 자산의 수가 적으면서 안정적이고 쉽게 적용 가능한 포트폴리오 모형을 제안한다. 그리고 실증 데이터 분석을 통하여 모형의 타당성을 입증한다.


Many researches have been done on portfolio optimization since Markowitz (1952) published a diversified investment model. Markowitz's mean-variance portfolio optimization problem is established under the assumption that the distribution of returns follows a normal distribution. However, in real life, the distribution of returns does not follow a normal distribution, and variance is not a robust statistic as it is heavily influenced by outliers. To overcome these potential issues, mean-shortfall portfolio model was proposed that utilized downside risk, shortfall, as a risk index. In this paper, we propose a perturbation method that uses the shortfall as a risk index of the portfolio. The proposed portfolio utilizes an adaptive Lasso to obtain a sparse and stable asset selection because it can reduce management and transaction costs. The proposed optimization is easily applicable as it can be computed using an efficient linear programming. In our real data analysis, we show the validity of the proposed perturbation method.

KCI등재

5모바일 인터넷 뉴스 이용자의 속성이 정치, 경제, 사회적 주요 현안에 대한 의견 형성에 미치는 영향에 대한 통계적 분석

저자 : 김재희 ( Jaehee Kim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 34권 1호 발행 연도 : 2021 페이지 : pp. 57-74 (18 pages)

다운로드

(기관인증 필요)

초록보기

스마트폰과 태블릿PC 등의 스마트기기의 확산으로 모바일 기반 인터넷의 이용률이 눈에 띄게 증가하였으며, 이로 인해 모바일 인터넷의 영향력도 중요해졌다. 따라서 본 연구는 지난 일주일동안 모바일 인터넷을 통해 뉴스를 본 뉴스 이용자의 어떠한 특성들에 따라 정치, 경제, 사회적 주요 현안에 대한 의견을 형성할 때 모바일 인터넷의 영향을 받는지 파악하고자 수행되었다. 이를 위해 한국 언론 진흥재단의 2016년과 2017년의 언론수용자 의식조사의 자료를 분석에 사용하였다. 모바일 인터넷 뉴스 이용자의 성별, 연령, 학력, 가구소득, 뉴스 이용일수, 뉴스 이용시간, 언론사 애플리케이션 이용일수, 뉴스모음 애플리케이션 이용일수, 포털 이용일수, 언론사 공식 홈페이지 이용일수를 뉴스 이용자의 특성으로 지정하였다. 모바일 인터넷 의견 형성 여부에 뉴스 이용자의 어떠한 특성이 영향을 미치는지 알아보기 위해 다중 로지스틱 회귀를 적합하고 해석하였다.


The proliferation of smart devices (such as smart phones and tablet PCs) has led to a marked increase in the use of mobile-based internet. As a result, the influence of the mobile internet has become important to make opinions on social issues. This study explores the effects of mobile internet news users' characteristics on formation of opinions about major political, economic and social issues. We used the data from the media audience awareness survey by the Korean Press Foundation in 2016 and 2017 in this analysis. The characteristics of the news users are gender, age, education, income, news usage days, news usage hours, media application usage days, news gathering application usage days, portal usage days, and media official website usage days. These characteristics are known as possible explanatory variables for the mobile internet news users. Multiple logistic regressions were done with interpretation to know which covariates affect on formation of major opinion.

KCI등재

6초저출산율에 따른 시도별 출산율 변동을 반영한 예측 연구

저자 : 오진호 ( Jinho Oh )

발행기관 : 한국통계학회 간행물 : 응용통계연구 34권 1호 발행 연도 : 2021 페이지 : pp. 75-98 (24 pages)

다운로드

(기관인증 필요)

초록보기

본 논문은 전국과 시도별 출산율의 관계를 규명하는 세 가지 통계적 모형을 비교한다. 세 모형은 10년간 평균 연령별 누적출산율의 Gompit변환 자료를 대입한 회귀모형, 연령별 출산율 자료 변환 없이 원자료를 적용한 회귀모형, 그리고 확률과정 관점에서 불안정한 연령별 출산율 시계열을 적합할 경우 고려할 수 있는 공적분 모형이다. 본 논문은 전국과 지역간 비정상성 출산율의 관계를 도출하고자 할 때 다음을 제안한다. 전국과 지역 출산율의 공적분 관계식를 선행적으로 도출한다. 더 나아가 이 관계가 유의하지 않으면 변환 없는 원자료를 활용한 회귀모형 접근으로 전국과 시도별 출산율 관계를 살펴보는 것을 제안한다. 또한 Gompit변환 자료를 대입한 회귀모형 방법은 출산율이 다른 방식과 비교해 과대추정되는 결과가 도출되었다. 끝으로 서울, 부산, 대구, 인천, 광주, 대전, 경기는 2025~2030년까지 타 지역과 다르게 합계출산율이 1.0명 이하로 예측되므로 시급하고 효율성 있는 출산율 제고정책이 필요하다고 판단된다.


This paper compares three statistical models that examine the relationship between national and provincespecific fertility rates. The three models are two of the regression models and a cointegration model. The regression model is by substituting Gompit transformation for the cumulative fertility rate by the average for ten years, and this model applies the raw data without transformation of the fertility data. A cointegration model can be considered when fitting the unstable time series of fertility rate in probability process. This paper proposes the following when it is intended to derive the relation of non-stationary fertility rate between the national and provinces. The cointegrated relationship between national and regional fertility rates is first derived. Furthermore, if this relationship is not significant, it is proposed to look at the national and regional fertility rate relationships with a regression model approach using raw data without transformation. Also, the regression model method of substituting Gompit transformation data resulted in an overestimation of fertility rates compared to other methods. Finally, Seoul, Busan, Daegu, Incheon, Gwangju, Daejeon and Gyeonggi province are expected to show a total fertility rate of 1.0 or less from 2025 to 2030, so an urgent and efficient policy to raise this level is needed.

KCI등재

7Smart Factory Big Data를 활용한 공정 이상 탐지 프로세스 적용 사례 연구

저자 : 남현우 ( Hyunwoo Nam )

발행기관 : 한국통계학회 간행물 : 응용통계연구 34권 1호 발행 연도 : 2021 페이지 : pp. 99-114 (16 pages)

다운로드

(기관인증 필요)

초록보기

반도체 제조 산업에서는 Big Data에 기초한 Smart Factory 도입과 적용이 가시화되면서 생산 공정의 각 단계에서 수집 가능한 다양한 센서(sensor) 데이터를 활용하여 공정 이상 탐지 및 최종 수율 예측 등에 다양한 분석 방법을 시도하고 있다. 현재 반도체 공정은 원료인 잉곳(ingot)에서 패키징(packaging) 작업 이전의 웨이퍼(wafer) 생산까지 500~600개 이상의 세부 공정과 이와 연계된 수천 개의 계측 공정으로 구성된다. 개별 계측 공정 내의 실제 계측 비율은 대상 제품 대비 0.1%에서 최대 5%를 넘지 못하고 계측 시점별로 일정하게 유지할 수 없다. 이러한 이유로 공정 각 단계의 정상 상태를 간접적으로 판단할 수 있는 장비 센서(sensor) 데이터를 활용하여 관리 여부를 판단하고자 하는 노력이 계속되고 있다. 본 연구에서는 장비 센서 데이터 기반의 공정 이상 탐지 프로세스를 정의하고 현재 적용 되고 있는 기술 통계량 기반 진단 방법의 단점을 보완하기 위해 FDA(Functional Data Analysis)방법을 활용하였다. 실제 현장 사례 데이터에 머신러닝을 이용하여 이상 탐지 정확도 비교를 통해 효과성을 검증하였다.


With the Fourth Industrial Revolution based on new technology, the semiconductor manufacturing industry researches various analysis methods such as detecting process abnormalities and predicting yield based on equipment sensor data generated in the manufacturing process. The semiconductor manufacturing process consists of hundreds of processes and thousands of measurement processes associated with them, each of which has properties that cannot be defined by chemical or physical equations. In the individual measurement process, the actual measurement ratio does not exceed 0.1% to 5% of the target product, and it cannot be kept constant for each measurement point. For this reason, efforts are being made to determine whether to manage by using equipment sensor data that can indirectly determine the normal state of each step of the process. In this study, the Functional Data Analysis (FDA) was proposed to define a process abnormality detection process based on equipment sensor data and compensate for the disadvantages of the currently applied statistics-based diagnosis method. Anomaly detection accuracy was compared using machine learning on actual field case data, and its effectiveness was verified.

KCI등재

8통화정책 결정문에 나타난 한미 통화정책 동조화 현상 분석

저자 : 장영재 ( Youngjae Chang )

발행기관 : 한국통계학회 간행물 : 응용통계연구 34권 1호 발행 연도 : 2021 페이지 : pp. 115-126 (12 pages)

다운로드

(기관인증 필요)

초록보기

중앙은행은 통화정책을 운용하면서 통화정책 방향에 관한 보고서를 통해 시장과 소통하고 있다. 최근의 Covid-19 팬데믹은 세계적인 경제의 급격한 위축을 초래하였다. 2008년 글로벌 금융위기 시와 비교해 보더라도 불확실성이 적지 않은 상황이다. 그 파급효과가 전 세계적으로 확산되면서 경기침체의 장기화에 관한 우려도 증폭되고 있다. 본 논문에서는 미 연준과 한국은행의 통화정책을 담고 있는 통화정책방향 결정문과 의결문의 특징을 분석하고 세계적인 위기에 어떠한 영향을 받았는지 살펴보았다. 분석을 위해 1999년 10월부터 2020년 9월까지 공표된 양 국가의 통화정책방향 보고서 텍스트 자료를 수집하였으며 워드 클라우드 및 워드 임베딩 등을 이용하여 의미상 특징을 살펴보았다. 조각별 회귀나무 모형을 통해 양국 문서의 비유사성 추이도 분석해 보았다. 분석 결과 한국은행과 미 연준 모두 시장과의 투명하고 효과적인 소통을 위해 명확한 의미를 지닌 단어로 정제된 문서 자료를 작성하고 있는 것으로 나타났다. 또한, 급격한 글로벌 경제환경의 변화가 통화정책에 영향을 미치면서 문서 간 의미상 동조화가 이루진 것으로 나타났다.


Central banks communicate with the market through a statement on the direction of monetary policy while implementing monetary policy. The rapid contraction of the global economy due to the recent Covid-19 pandemic could be compared to the crisis situation during the 2008 global financial crisis. In this paper, we analyzed the text data from the monetary policy statements of the Bank of Korea and Fed reflecting monetary policy directions focusing on how they were affected in the face of a global crisis. For analysis, we collected the text data of the two countries' monetary policy direction reports published from October 1999 to September 2020.We examined the semantic features using word cloud and word embedding, and analyzed the trend of the similarity between two countries' documents through a piecewise regression tree model. The visualization result shows that both the Bank of Korea and the US Fed have published the statements with refined words of clear meaning for transparent and effective communication with the market. The analysis of the dissimilarity trend of documents in both countries also shows that there exists a sense of synchronization between them as the rapid changes in the global economic environment affect monetary policy.

1

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기