간행물

한국통계학회> 응용통계연구

응용통계연구 update

The Korean Journal of Applied Statistics

  • : 한국통계학회
  • : 자연과학분야  >  통계학
  • : KCI등재
  • :
  • : 연속간행물
  • : 격월
  • : 1225-066x
  • : 2383-5818
  • :

수록정보
32권4호(2019) |수록논문 수 : 12
간행물 제목
32권4호(2019년) 수록논문
권호별 수록 논문
| | | |

KCI등재

1더블딥 출산율 요인 규명과 향후 추이

저자 : 오진호 ( Jinho Oh )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 4호 발행 연도 : 2019 페이지 : pp. 463-483 (21 pages)

다운로드

(기관인증 필요)

초록보기

2000년 이후 우리나라 합계출산율은 일본, 독일, 프랑스처럼 출산율이 상승이나 감소기조에 들어서면 쉽게 변하지 않는 비가역적인 상수형태를 보이는 것과는 다른 양상을 보인다. 또한 2005년 1.08명 최저점에서 서서히 증가해 2015년 1.23명을 보이다가 2016년 1.17명, 2017년 1.05명, 2018년 0.98명으로 급락하고 있다. 이는 마치 경기침체의 더블딥(double dip)과 유사한 형태를 보인다. 본 연구는 이러한 TFR 증감 요인을 규명하기 위해 먼저 TFR에 영향력이 높은 출생아수 추이와 예측, TFR 분해법으로 분해되는 유배우율과 유배우출산율의 추이를 살펴본다. 그리고 이들 변화가 TFR 증감 변화에 어떤 영향력을 나타내는지 살펴보았다. 분석결과 출생아수는 2018년 약 32-33만 명, 2020년 30만 명, 2025년은 23-24만 명 수준을 보일 것으로 추정된다. 유배우율은 1981-2025년까지 지속적으로 감소, 유배우출산율은 2002년 이전까지 감소를 보이다가 2003-2016년 증가추세를 보인후 2017-2025년까지 감소추세로 이어질 것으로 예측되었다. 끝으로 출생아수, 출산율 분해와 통계적 모형으로 살펴본 TFR 향후 추이는 2018년 0.98명, 2020년 0.93-1.11명, 2025년에는 0.76-1.08명으로 분석되었다.


Since 2000, Korea's total fertility rate (TFR) has been different from that of Japan, Germany, and France where irreversible constants do not change easily in the fertility rate increasing or decreasing phase. It also showed a gradual increase from the minimum fertility level 1.08 in 2005 to 1.23 in 2015, which dropped to 1.17 in 2016, to 1.05 in 2017 and to 0.98 in 2018. This is similar to a double dip in the economic status of a recession. This paper investigates such a TFR increase and decrease factor that predicts the number of births affecting TFR, examines trends in the proportion of married and marital fertility rate broken down by TFR decomposition method. We also examined how these changes affect the change in TFR. According to the results, the number of births is estimated to be between 320 and 330 thousand in 2018, 300 thousand in 2020, 230 and 240 thousand in 2025. The proportion of married is steadily decreasing from 1981 to 2025, and the marital fertility rate is predicted to decline until 2002, then increase from 2003 to 2016 and decrease from 2017 to 2025. Finally, the trend of TFR in terms of number of births, TFR decomposition and statistical model is expected to show 0.98 in 2018, 0.93 to 1.11 in 2020 and 0.76 to 1.08 in 2025.

KCI등재

2이론통계학 교육에서 수학 소프트웨어의 활용

저자 : 이긍희 ( Geung-hee Lee )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 4호 발행 연도 : 2019 페이지 : pp. 485-502 (18 pages)

다운로드

(기관인증 필요)

초록보기

이론통계학은 통계학의 원리를 수학을 이용하여 배우는 교과목이다. 학생들이 수학을 충분히 알지 못하는 경우 이론통계학 교육을 통해 통계학의 원리를 이해하는 데에는 제약이 있다. 이론통계학 교육을 통해 통계학의 원리에 대한 이해를 높이기 위해 수학적 문제풀이 외에 R 프로그램을 이용한 통계 시뮬레이션이 보조적으로 도입되어 왔지만 수학을 이용한 문제풀이를 대신하지는 못하고 있다. 이 논문에서는 wxMaxima, Wolfram Alpha 등 기호 수학 연산이 가능한 수학 소프트웨어 CAS를 소개하고, 이를 이용하여 이론통계학 교육에 걸림돌이 되는 수학의 어려움에서 벗어나 통계학의 원리 자체를 학습할 수 있는 방안을 모색하였다.


Theoretical statistics is a calculus based course. However, there are limitations to learn theoretical statistics when students do not know enough calculus techniques. Mathematical softwares (computer algebra systems) that enable calculus manipulations help students understand statistical concepts, by avoiding the difficulties of calculus. In this paper, we introduce mathematical software such as Maxima and Wolfram Alpha. To foster statistical concepts in theoretical statistics education, we present three examples that consist of mathematical derivations using wxMaxima and statistical simulations using R.

KCI등재

3국회 법안 검토 기간의 생존함수 추정: 제 17, 18, 19대 국회의 사례를 바탕으로

저자 : 윤영규 ( Yeonggyu Yun ) , 조윤수 ( Yunsoo Cho ) , 정혜영 ( Hye-young Jung )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 4호 발행 연도 : 2019 페이지 : pp. 503-515 (13 pages)

다운로드

(기관인증 필요)

초록보기

본 연구는 제 17, 18, 19대 국회에 제출된 법안의 검토 기간의 생존함수를 추정하고, 정치상황적 요인들이 법안 검토 기간에 미치는 영향을 분석했다. 본 연구는 입법 데이터에 존재하는 절단과 사건 종료의 종속성 문제를 완화하고자 새로운 관점에서 입법 과정 종료를 정의했다. 또한 비례위험 가정이 분석 대상 데이터에 대해 성립하지 않는다는 것을 보이고, 이에 따라 로그정규분포 가정 하의 가속종료시간모형을 통해 정치상황 상의 요인들이 법안 검토 기간에 미치는 영향을 분석했다. 분석 결과 정책 분야별로 법안 검토 기간이 상이하게 나타났고, 여소야대 시기에 발의된 법안이 그렇지 않은 시기에 발의된 법안보다 신속하게 검토된 것으로 나타났다.


In this study we estimate the survival function of duration of the legislative processes in the 17th, 18th, and 19th National Assembly of Korea, and further analyze effects of the political situation variables on the legislative process. We define the termination of legislative process from a novel perspective to alleviate issues of dependency between censoring and failure in the data. We also show that the proportional hazards assumption does not hold for the data, and analyze data employing a log-normal accelerated failure time model. The policy areas of law agendas are shown to affect the speed of legislative process in different ways and legislative process tends to be prompt in times of divided governments.

KCI등재

4일관성 함수적 자료모형을 활용한 국제인구이동의 확률적 예측

저자 : 김순영 ( Soon-young Kim ) , 오진호 ( Jinho Oh )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 4호 발행 연도 : 2019 페이지 : pp. 517-541 (25 pages)

다운로드

(기관인증 필요)

초록보기

OECD (2015)과 UN (2017)에 따르면 한국은 입국의 나라로 분류되고 있다. 입국의 나라는 순이동(net migration)이 양으로 유지된다는 것을 뜻하며, 동시에 국제이동이 인구증가에 영향을 미칠 가능성이 높음을 의미한다. 통계청 (2011)은 이전 추계와는 달리 인구이동요인을 고려한 Wilson (2010)모형을 기반으로 성별 및 입_출국을 구분하여 모수가 15개 이상인 모형을 이용하였다. 그리고 5년 뒤 2016년 추계에서는 최근 5년간의 내국인 순이동률 평균치와 외국인 정부정책을 반영한 값을 가정하였다. 하지만 이 두 결과 모두 국제이동이 보수적으로 추정되어 입국의 나라로 추정하는 OECD, UN의 분류와는 다른 결과를 제공한다. 따라서 본 연구는 입국, 출국 그리고 순이동의 국제이동추이가 선형이 아닌 비선형임을 착안하여 우리나라 2000-2017년 국제이동 자료에 함수적 자료모형을 활용한 비모수 모형 (Hyndman과 Ullah (2007)이 제안한 FDM, Hyndman 등 (2013)가 제안한 Coherent FDM)을 적용하여 확률론적 추계방식으로 향후 추이를 예측하였다. 분석결과 입국률은 2018년 인구천명당 1.098명(남자), 1.026명(여자), 2025년 1.228명(남자), 1.152명(여자) 그리고 출국률은 2018년 인구천명당 0.907명(남자), 0.879명(여자), 2025년 0.987명(남자), 0.959명(여자)으로 나타났다. 따라서 순이동률은 인구천명당 2018년 0.191명(남자), 0.148명(여자), 2025년 0.241명(남자), 0.192명(여자)으로 증가하는 결과가 도출되었다.


According to the OECD (2015) and UN (2017), Korea was classified as an immigration country. The designation as an immigration country means that net migration will remain positive and international migration is likely to affect population growth. KOSTAT (2011) used a model with more than 15 parameters to divide sexes, immigration and emigration based on the Wilson (2010) model, which takes into account population migration factors. Five years later, we assume the average of domestic net migration rate for the last five years and foreign government policy likely quota. However, both of these results were conservative estimates of international migration and provide different results than those used by the OECD and UN to classify an immigration country. In this paper, we proposed a stochastic projection on international migration using nonparametric model (FDM by Hyndman and Ullah (2007) and Coherent FDM by Hyndman et al. (2013)) that uses a functional data model for the international migration data of Korea from 2000-2017, noting the international migration such as immigration, emigration and net migration is non-linear and not linear. According to the result, immigration rate will be 1.098(male), 1.026(female) in 2018 and 1.228(male), 1.152(female) in 2025 per 1000 population, and the emigration rate will be 0.907(male), 0.879(female) in 2018 and 0.987(male), 0.959(female) in 2025 per 1000 population. Thus the net migration is expected to increase to 0.191(male), 0.148(female) in 2018 and 0.241(male), 0.192(female) in 2025 per 1000 population.

KCI등재

5비선형 모델을 이용한 결측 대체 방법 비교

저자 : 김혜인 ( Hyein Kim ) , 송주원 ( Juwon Song )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 4호 발행 연도 : 2019 페이지 : pp. 543-559 (17 pages)

다운로드

(기관인증 필요)

초록보기

자료에는 다양한 원인에 의해 결측이 발생한다. 만약 결측치를 제외하고 완전히 관찰된 자료만으로 분석을 실시한다면 결측자료 메커니즘이 완전임의결측이 아닌 경우 결과에 편향이 발생하거나 제외된 개체로 인한 정보의 손실로 추정의 정밀도가 약화된다. 결측이 하나의 변수에서만 일어나지 않기 때문에, 자료에 변수가 많을 수록 이 문제는 심화된다. 문제를 개선하기 위해 결측치를 대체하는 여러가지 방법들이 제안되었다. 하지만 모수적인 모형을 이용한 대체 방법들은 가정에 위배되는 현실 데이터에는 적합하지 않다. 따라서 본 연구에서는 자료의 분포 가정에 덜 영향을 받는 커널, 리샘플링, 스플라인 방법을 활용한 비선형 대체 방법들을 리뷰하고 필요한 경우 기존의 비선형 대체방법에 대체클래스를 사용하여 대체값의 정확도를 높이거나 랜덤성을 가지는 오차를 더해주어 추정치의 분산이 적게 추정되는 문제를 개선하는 확장된 결측 대체 방법을 제안한다. 본 연구에서 고려한 여러 가지 대체 방법들은 다양한 모의자료 설계 하에서 성능을 비교하였다. 모의실험 결과, 비선형 대체 방법들은 각 설계 하에 다른 성능을 보이며 전반적으로 커널 회귀나 스플라인을 활용한 대체 방법들이 좋은 성능을 보였다. 더불어, 확장된 대체 방법은 기존의 대체 방법이 가지는 문제점을 개선함을 확인할 수 있었다.


Data often include missing values due to various reasons. If the missing data mechanism is not MCAR, analysis based on fully observed cases may an estimation cause bias and decrease the precision of the estimate since partially observed cases are excluded. Especially when data include many variables, missing values cause more serious problems. Many imputation techniques are suggested to overcome this difficulty. However, imputation methods using parametric models may not fit well with real data which do not satisfy model assumptions. In this study, we review imputation methods using nonlinear models such as kernel, resampling, and spline methods which are robust on model assumptions. In addition, we suggest utilizing imputation classes to improve imputation accuracy or adding random errors to correctly estimate the variance of the estimates in nonlinear imputation models. Performances of imputation methods using nonlinear models are compared under various simulated data settings. Simulation results indicate that the performances of imputation methods are different as data settings change. However, imputation based on the kernel regression or the penalized spline performs better in most situations. Utilizing imputation classes or adding random errors improves the performance of imputation methods using nonlinear models

KCI등재

6SMUCE와 FDR segmentation 방법에 의한 다중변화점 추정법 비교

저자 : 김재희 ( Jaehee Kim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 4호 발행 연도 : 2019 페이지 : pp. 561-572 (12 pages)

다운로드

(기관인증 필요)

초록보기

본 연구는 다층적 다중변화점 추정법으로 FDRSeg 기법과 SMUCE 기법의 이론적 특성을 파악하고 모의실험을 통해 경험적 특성을 비교하고자한다. FDRSeg (False discovery rate segmentation)기법은 FDR 기반 조절을 하여 변화점을 추정하고 SMUCE (simultaneous multiscale change-point estimator) 기법은 국소우도함수 기반 다중 검정으로 변화점을 추정한다. 변화점의 개수가 작을경우에는 두 기법에 의한 추정능력이 비슷하다. 변화점 개수가 많을수록 FDRSeg 의 추정이 변화점 개수와 추정측도 면에서 더 좋은 편이다. 실제 데이터 분석으로 검층 주상도 데이터에 대해 각 기법으로 다중변화점 추정을 하고 비교한다.


We study false discovery rate segmentation (FDRSeg) and simultaneous multiscale change-point estimator (SMUCE) methods for multiscale multiple change-point estimation, and compare empirical behavior via simulation. FSRSeg is based on the control of a false discovery rate while SMUCE used for the multiscale local likelihood ratio tests. FDRSeg seems to work best if the number of change-points is large; however, FDRSeg and SMUCE methods can both provide similar estimation results when there are only a small number of change-points. As a real data application, multiple change-points estimation is done with the well-log data.

KCI등재

7컨볼루션 뉴럴 네트워크를 이용한 한글 서체 특징 연구

저자 : 황인경 ( In-kyeong Hwang ) , 원중호 ( Joong-ho Won )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 4호 발행 연도 : 2019 페이지 : pp. 573-591 (19 pages)

다운로드

(기관인증 필요)

초록보기

로마자 서체에 대한 수치적 분류체계는 잘 발달되어 있지만, 한글 서체 분류를 위한 기준은 수치적으로 잘 정의되어 있지 않다. 본 연구의 목표는 한글 서체 분류를 위한 수치적 기준을 세우기 위해, 서체 스타일을 구분하는 중요한 특징들을 찾는 것이다. 컨볼루션 뉴럴 네트워크(convolutional neural network)를 사용하여 명조와 고딕 스타일을 구분하는 모형을 세우고, 학습된 필터를 분석해 두 스타일의 특징을 결정하는 피처(feature)를 찾고자 한다.


Classification criteria for Korean alphabet (Hangul) fonts are undeveloped in comparison to numerical classification systems for Roman alphabet fonts. This study finds important features that distinguish typeface styles in order to help develop numerical criteria for Hangul font classification. We find features that determine the characteristics of the two different styles using a convolutional neural network to create a model that analyzes the learned filters as well as distinguishes between serif and sans-serif styles.

KCI등재

8절단함수를 이용한 AUC와 VUS

저자 : 홍종선 ( Chong Sun Hong ) , 홍성혁 ( Seong Hyuk Hong )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 4호 발행 연도 : 2019 페이지 : pp. 593-605 (13 pages)

다운로드

(기관인증 필요)

초록보기

ROC 곡선 아래 면적과 ROC 곡면 아래 부피를 이용하여 분류모형의 판별력을 측정하는 통계량인 AUC와 VUS에 관한 많은 연구가 있다. ROC 곡선을 구성하는 FPR과 TPR 모두에 제한을 두는 양방향 부분 AUC는 부분 AUC보다 더 효과적이고 정확하게 제안되었다. ROC 곡면에서도 부분 VUS 뿐만 아니라 세 방향 부분 VUS 통계량이 개발되었다. 본 연구에서는 ROC 곡선의 FPR과 TPR 모두에 제한된 두 개의 절단함수를 이용하여 확률 개념과 적분 표현으로 대안적인 AUC를 제안한다. 또한 이 AUC는 양방향 부분 AUC와 관계가 있음을 알 수 있다. ROC 곡면에서의 세 방향 부분 VUS도 절단함수를 이용하는 VUS와 관련되어 있음을 발견하였다. 그리고 이러한 대안적인 AUC와 VUS는 맨-휘트니 통계량으로 표현되고 추정된다. 정규분포와 확률표본을 기반으로 이들의 모수적인 추정 방법과 비모수적인 추정 방법을 탐색한다.


Significant literature exists on the area under the ROC curve (AUC) and the volume under the ROC surface (VUS) which are statistical measures of the discriminant power of classification models. Whereas the partial AUC is restricted on the false positive rate, the two-way partial AUC is restricted on both the false positive rate and true positive rate, which could be more efficient and accurate than partial AUC. The two-way partial AUC was suggested as more efficient and accurate than the partial AUC. Partial VUS as well as the three-way partial VUS were also developed for the ROC surface. A proposed AUC is expressed in this paper with probability and integration using two truncated distribution functions restricted on both the false positive rate and true positive rate. It is also found that this AUC has a relation with the two-way partial AUC. The three-way partial VUS for the ROC surface is also related to the VUS using truncated distribution functions. These AUC and VUS are represented and estimated in terms of Mann-Whitney statistics. Their parametric and non-parametric estimation methods are explored based on normal distributions and random samples.

KCI등재

9함수형 선형모형에서의 B-스플라인에 기초한 검정

저자 : 손지훈 ( Jihoon Sohn ) , 이은령 ( Eun Ryung Lee )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 4호 발행 연도 : 2019 페이지 : pp. 607-618 (12 pages)

다운로드

(기관인증 필요)

초록보기

현대 과학기술의 발전으로 인해 함수 형태의 자료(functional data)는 기상학, 생물의학과 다양한 분야에서 발생하고 있으며 이러한 자료를 분석하는 것은 새롭고 흥미로운 통계과제라 할 수 있다. 스칼라 반응변수를 가진 함수형 선형회귀 모형(functional linear regression models with scalar response)은 널리 사용되는 함수형 자료 분석기법 중의 하나라 할 수 있고 이 회귀 모형에서 함수형 자료 (설명변수) 가 스칼라 반응변수에 영향력을 미치는지 검정하는 것은 중요한 문제라 할 수 있다. 최근, Kong 등은 함수형 주성분분석(functional principle component analysis)에 의한 차원 축소, 즉, 함수형 주성분분석 결과 얻어지는 고유함수(eigenfunctions)를 활용한 검정방법을 제안했다. 하지만, 그 고유함수들은 검정문제에서 관심사인 함수형 설명변수와 스칼라 반응변수의 연관성이 아니라 함수형 설명변수의 변동만을 고려하기 때문에 회귀문제에 사용하기에 일반적으로 적합한 기저가 아니다. 게다가, 자료로부터 추정하여야 하기 때문에 이 불필요한 추정오차가 검정 절차 성능에 포함될 가능성이 있다. 이러한 단점을 피하기 위해 본 논문에서는 기존의 고유기저함수가 아닌 고정기저(fixed basis)인 B-스플라인(B-splines) 함수를 활용한 검정 방법을 제안한고 모의실험을 통해 검정방법이 잘 작동한다는 것을 보여준다. 또한, 제안한 검정 방법은 B-스플라인의 국소화 성질 때문에 때론 효율적이고 직관적인 결과를 제공하는데 이를 모의실험과 실증자료 분석을 통해 보여줄 것이다.


A new and interesting task in statistics is to effectively analyze functional data that frequently comes from advances in modern science and technology in areas such as meteorology and biomedical sciences. Functional linear regression with scalar response is a popular functional data analysis technique and it is often a common problem to determine a functional association if a functional predictor variable affects the scalar response in the models. Recently, Kong et al. (Journal of Nonparametric Statistics, 28, 813-838, 2016) established classical testing methods for this based on functional principal component analysis (of the functional predictor), that is, the resulting eigenfunctions (as a basis). However, the eigenbasis functions are not generally suitable for regression purpose because they are only concerned with the variability of the functional predictor, not the functional association of interest in testing problems. Additionally, eigenfunctions are to be estimated from data so that estimation errors might be involved in the performance of testing procedures. To circumvent these issues, we propose a testing method based on fixed basis such as B-splines and show that it works well via simulations. It is also illustrated via simulated and real data examples that the proposed testing method provides more effective and intuitive results due to the localization properties of B-splines.

KCI등재

10순수 베이지안 분류기 모델을 사용하여 이상지질혈증을 예측하는 노모 그램 구축

저자 : 김민호 ( Min-ho Kim ) , 서주현 ( Ju-hyun Seo ) , 이긍희 ( Jea-young Lee )

발행기관 : 한국통계학회 간행물 : 응용통계연구 32권 4호 발행 연도 : 2019 페이지 : pp. 619-630 (12 pages)

다운로드

(기관인증 필요)

초록보기

이상지질혈증은 한국인의 대표적인 성인병이며 지속적인 관리가 필요한 만성질환이다. 또한 고혈압이나 당뇨병과 함께 심혈관계 질환의 위험 요인으로 잘 알려져 있다. 하지만 혈관 질환은 검사 없이는 질병 판단을 하기 어려운 것이 현실이다. 본 연구에서는 이상지질혈증의 인지와 예방을 위하여 관련된 위험 요인을 확인한다. 이들을 종합하여 시각화하면서 발병률 예측까지 가능한 통계적 도구 노모그램을 구축하였다. 데이터는 국민건강영양조사 6기, 7기 제1차년도 (2013-2016) 데이터를 사용하였다. 분석 순서로는 먼저 이상지질혈증의 총 12가지 위험 요인을 교차분석을 통해 확인하였다. 그리고 순수 베이지안 분류기를 이용하여 이상지질혈증에 대한 모형으로 노모그램을 구축하였다. 구축한 노모그램은 ROC 곡선과 Calibration plot을 사용하여 신뢰성을 검증하였다. 마지막으로 이전에 제시했던 로지스틱 노모그램과 본 연구에서 제안한 베이지안 노모그램을 비교하였다.


Dyslipidemia is a representative chronic disease affecting Koreans that requires continuous management. It is also a known risk factor for cardiovascular disease such as hypertension and diabetes. However, it is difficult to diagnose vascular disease without a medical examination. This study identifies risk factors for the recognition and prevention of dyslipidemia. By integrating them, we construct a statistical instrumental nomogram that can predict the incidence rate while visualizing. Data were from the Korean National Health and Nutrition Examination Survey (KNHANES) for 2013-2016. First, a chi-squared test identified twelve risk factors of dyslipidemia. We used a na□ve Bayesian classifier model to construct a nomogram for the dyslipidemia. The constructed nomogram was verified using a receiver operating characteristics curve and calibration plot. Finally, we compared the logistic nomogram previously presented with the Bayesian nomogram proposed in this study.

12

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기