간행물

한국통계학회> 응용통계연구

응용통계연구 update

The Korean Journal of Applied Statistics

  • : 한국통계학회
  • : 자연과학분야  >  통계학
  • : KCI등재
  • :
  • : 연속간행물
  • : 격월
  • : 1225-066x
  • : 2383-5818
  • :

수록정보
수록범위 : 1권1호(1987)~33권2호(2020) |수록논문 수 : 1,870
응용통계연구
33권2호(2020년 04월) 수록논문
최근 권호 논문
| | | |

KCI등재

1스펙트럴 클러스터링 - 요약 및 최근 연구동향

저자 : 정상훈 ( Sanghun Jeonga ) , 배수현 ( Suhyeon Baea ) , 김충락 ( Choongrak Kima )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 2호 발행 연도 : 2020 페이지 : pp. 115-122 (8 pages)

다운로드

(기관인증 필요)

초록보기

K-평균 클러스터링은 매우 널리 사용되고 있으나 유사도가 구면체 또는 타원체로 정의되어 각 클러스터가 볼록 집합 형태인 자료에는 좋은 결과를 주지만 그렇지 않은 경우에는 매우 형편 없는 결과를 나타낸다. 스펙트럴 클러스터링은 K-평균 클러스터링의 단점을 잘 보완해 줄 뿐아니라 여러 형태의 자료나 고차원 자료 등에 대해서도 좋은 결과를 나타내서 최근 인공 신경망 모형에 많이 이용되고 있다. 하지만, 개선되어야 할 단점도 여전히 많다. 본 논문에서는 스펙트럴 클러스터링에 대해 알기 쉽게 소개하고, 클러스터 갯수의 추정, 척도모수의 추정, 고차원 자료의 차원축소 등 스펙트럴 클러스터링에 대한 최근의 연구 동향을 소개한다.


K-means clustering uses a spherical or elliptical metric to group data points; however, it does not work well for non-convex data such as the concentric circles. Spectral clustering, based on graph theory, is a generalized and robust technique to deal with non-standard type of data such as non-convex data. Results obtained by spectral clustering often outperform traditional clustering such as K-means. In this paper, we review spectral clustering and show important issues in spectral clustering such as determining the number of clusters K, estimation of scale parameter in the adjacency of two points, and the dimension reduction technique in clustering high-dimensional data.

KCI등재

2발달 독성학에서 비대칭 로짓 모형을 사용한 이진수 자료와 연속형 자료에 대한 결합분석

저자 : 김영화 ( Yeong-hwa Kima ) , 황범석 ( Beom Seuk Hwanga )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 2호 발행 연도 : 2020 페이지 : pp. 123-136 (14 pages)

다운로드

(기관인증 필요)

초록보기

하나의 개체에서 여러가지 측정치가 동시에 관찰되는 경우는 다양한 연구 분야에서 흔히 나타난다. 발달 독성학 연구에서는 특정 독성 물질의 각기 다른 수준에 노출된 임신한 어미 쥐에 대해 기형인 태아의 존재와 태아의 무게가 동시에 측정된다. 이런 두 변수를 결합하여 모형화하는 것은 각기 독립적인 두 모형으로 분석하는 것보다 더 효율적인 결과를 낸다고 알려져 있다. 대부분의 결합 모형은 정규분포를 랜덤효과로 가정하여 분석한다. 그러나 발달 독성학연구에서처럼 반응변수들의 분포가 독성 물질이 변함에 따라 불규칙하게 변하는 경우 정규분포의 가정으로는 그 특징을 잡아낼 수 없게 된다. 본 논문에서는 이진수 자료와 연속형 자료에 대해 비대칭 로짓 모형을 사용한 베이지안 결합모형을 제시한다. 본 모형은 비대칭 로짓 모형을 사용함으로써 반응변수의 분포의 형태가 독성 물질의 수준에 따라 대칭/비대칭의 형태를 자유롭게 띨 수 있는 장점을 가지고 있다. 모형의 적합성을 살펴보기 위해 발달 독성학연구에서 독성 물질 DEHP에 적용하여 그 결과를 확인해본다.


It is common to encounter correlated multiple outcomes measured on the same subject in various research fields. In developmental toxicity studies, presence of malformed pups and fetal weight are measured on the pregnant dams exposed to different levels of a toxic substance. Joint analysis of such two outcomes can result in more efficient inferences than separate models for each outcome. Most methods for joint modeling assume a normal distribution as random effects. However, in developmental toxicity studies, the response distributions may change irregularly in location and shape as the level of toxic substance changes, which may not be captured by a normal random effects model. Motivated by applications in developmental toxicity studies, we propose a Bayesian joint model for binary and continuous outcomes. In our model, we incorporate a skewed logit model for the binary outcome to allow the response distributions to have flexibly in both symmetric and asymmetric shapes on the toxic levels. We apply our proposed method to data from a developmental toxicity study of diethylhexyl phthalate.

KCI등재

3제 1상 임상시험에서 Biased Coin Design과 멈춤규칙을 이용한 MTD 추정법

저자 : 전소영 ( Soyoung Jeona ) , 김동재 ( Dongjae Kima )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 2호 발행 연도 : 2020 페이지 : pp. 137-145 (9 pages)

다운로드

(기관인증 필요)

초록보기

'투약용량 발견 시험(Dose Finding Study)'라고도 불리는 제 1상 임상시험은 동물 실험 혹은 시험관 실험을 통하여 개발된 신약물질을 사람에게 실시하는 첫 단계이다. 제1상 임상시험의 가장 주요한 목적은 환자에게 허용할 수 있고 최대의 효능을 가진 복용량을 결정하는 것이다. 본 논문에서는 이를 고려하여 최대허용용량(MTD)를 결정할 수 있는 적절한 추정방법을 제안하였다. 이 방법은 Biased coin design과 멈춤규칙을 이용하여 MTD를 추정한다. 제안하는 방법은 모의실험을 통해 기존의 방법들과 비교하였다.


Phase I clinical trials (Dose Finding Studies) are the first step in administering new drugs developed through animal experiments or in vitro experiments to humans. An important area of interest in designing Phase I clinical trials is determining the dose that provides the greatest efficacy and acceptable safe dose to the patient. In this paper, we propose a method to determine the maximum tolerated dose considering efficacy and safety using Biased coin design and stopping rule. The proposed method is compared with existing methods through simulation.

KCI등재

4계수형 시계열 모형을 위한 자동화 차수 선택 알고리즘

저자 : 지윤미 ( Yunmi Jia ) , 성병찬 ( Byeongchan Seonga )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 2호 발행 연도 : 2020 페이지 : pp. 147-160 (14 pages)

다운로드

(기관인증 필요)

초록보기

본 논문은 시계열 일반화 선형 모형의 하나인 계수형 시계열 모형에서 중요한 역할을 하는 과거 관측값과 조건부 평균값의 차수를 자동으로 결정하는 알고리즘을 연구한다. 본 알고리즘은 ARIMA 모형의 차수를 기반으로 시계열 일반화 선형 모형의 차수 후보군을 만들고, 차수 후보군의 조합을 이용하여 정보량 기준으로 최종 모형으로 선택한다. 제안된 알고리즘을 평가하기 위하여, 내재적 모형 및 내재적 시계열의 종류에 따른 시뮬레이션 및 실증 분석을 수행하고 예측력을 ARIMA 모형과 비교한다. 예측 성능 평가 결과, 계수형 시계열 분석에서 ARIMA 모형에 비해 시계열 일반화 선형 모형의 예측 성능이 우수함을 확인할 수 있다. 또한 실증분석으로서, 살인사건 발생 건수의 예측결과 ARIMA 모형보다 중기 및 장기 예측에서 우수한 성능을 나타내는 것을 확인할 수 있다.


In this paper, we study an algorithm that automatically determines the orders of past observations and conditional mean values that play an important role in count time series models. Based on the orders of the ARIMA model, the algorithm constitutes the order candidates group for time series generalized linear models and selects the final model based on information criterion among the combinations of the order candidates group. To evaluate the proposed algorithm, we perform small simulations and empirical analysis according to underlying models and time series as well as compare forecasting performances with the ARIMA model. The results of the comparison confirm that the time series generalized linear model offers better performance than the ARIMA model for the count time series analysis. In addition, the empirical analysis shows better performance in mid and long term forecasting than the ARIMA model.

KCI등재

5관리한계 설정에 따른 ¯X -S2 관리도의 성능

저자 : 홍휘주 ( Hwi Ju Honga ) , 이재헌 ( Jaeheon Leea )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 2호 발행 연도 : 2020 페이지 : pp. 161-170 (10 pages)

다운로드

(기관인증 필요)

초록보기

¯X-S2 관리도는 공정 평균과 산포의 변화를 동시에 탐지하는 전통적인 관리도들 중 하나이다. 일반적으로 사용하는 ¯X -S2 관리도의 설계 방법은 병행하는 관리도의 오경보율은 주어진 값을 만족하면서 각 관리도는 동일한 개별적인 오경보율을 갖도록 설정하는 것이다. 이 논문에서는 각 관리도의 개별 오경보율을 다르게 설정하고 이것이 ¯X-S2 관리도의 성능에 어떠한 영향을 주는지 살펴보았다. 이를 위해 ¯X 관리도의 오경보율을 S2 관리도의 오경보율에 배한 경우를 고려하였고, 값에 따른 ¯X-S2 관리도 성능을 비교하였다. 관리도의 성능을 평가하는 측도로는 특정한 변화에 대한 성능을 판단하는 경우 이상상태에서의 평균런길이를 사용하였고, 전반적인 성능을 판단하는 경우 RMI(relative mean index)를 사용하였다.


The combined ¯X -S2chart is a traditional control chart for simultaneously detecting mean and variance. Control limits for the combined ¯X -S2 chart are determined so that each chart has the same individual false alarm rate while maintaining the required false alarm rate for the combined chart. In this paper, we provide flexibility to allow the two charts to have different individual false alarm rates as well as evaluate the effect of flexibility. The individual false alarm rate of the ¯X chart is taken to be times the individual false alarm rate of the S2 chart. To evaluate the effect of selecting the value of , we use the out-of-control average run length and relative mean index as the performance measure for the combined ¯X -S2 chart.

KCI등재

6PITCHf/x를 이용한 투구의 질 평가

저자 : 박성민 ( Sungmin Parka ) , 장원철 ( Woncheol Janga )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 2호 발행 연도 : 2020 페이지 : pp. 171-184 (14 pages)

다운로드

(기관인증 필요)

초록보기

미국 메이저리그 야구 경기는 야구공을 추적하는 3대의 고속 카메라를 통해 모든 투구에 대한 궤적 데이터 PITCHf/x를 수집하고 공개한다. 선행 연구에서는 PITCHf/x 데이터를 통해 각 투구의 기대 피루타수를 계산하고 이를 토대로 투구의 질을 평가했다. 다만 기대 피루타수는 경기 득점으로 매번 이어지지 않기 때문에 각 투구가 승리에 기여하는 영향을 직접적으로 평가하지 못한다. 이 논문에서는 득점 기댓값과 득점 가치의 개념을 조합해 투구에 대한 기대 득점 가치를 계산하고 이를 통해 투구의 질을 랜덤 포레스트 모형으로 평가한 뒤, 기대 피루타수를 이용한 투구의 질 평가와 비교 분석한다.


Major League Baseball (MLB) records and releases the trajectory data for every baseball pitch, called the PITCHf/x, using three high-speed cameras installed in every stadium. In a previous study, the quality of the pitch was assessed as the expected number of bases yielded using PITCHf/x data. However, the number of bases yielded does not always lead to baseball scores, or runs. In this paper, we assess the quality of a pitch by combining baseball analytics metric Run Expectancy and Run Value using a Random Forests model. We compare the quality of pitches evaluated with Run Value to the quality of pitches evaluated with the expected number of bases yielded.

KCI등재

7미래의 불확실성에 대한 확률론적 인구추계

저자 : 오진호 ( Jinho Oha )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 2호 발행 연도 : 2020 페이지 : pp. 185-201 (17 pages)

다운로드

(기관인증 필요)

초록보기

예전부터 시나리오 인구추계(scenario population projection)는 미래 실현개연성이 높은 상황 반영과 통계적 음해석 용이성으로 각광을 받아왔다. 통계청 (2019)도 특별 시나리오를 포함한 30가지 조합 결과를 공식통계로 제시하고 있다. 하지만, 이런 결정론적(determinant) 인구추계는 미래의 불확실성(uncertainty)에 대해 제한적으로 정보를 제공하고, 시나리오 기반 예측치이므로 확률적이지 않으며, 시간에 따라 인구변동 3요소(출산, 사망, 이동)들의 완벽한 자기상관을 보이는 등 여러 한계점이 있다. 따라서 국제기구 UN, 독일 막스플랑크 인구연구소(MPIDR), 오스트리아 비엔나인구연구소(VID) 등은 확률론적(stochastic) 기반 인구추계를 제시하고 있다. 더불어 해외 일부국가 통계청에서도 이 방식을 도입해 시나리오 결과와 함께 정보를 제공하고 있다. 본 논문은 우리나라의 인구추계를 확률론적 기반으로 산출한 후, 시나리오(결정론적) 인구추계 결과와 비교해 장_단점과 시사점을 도출해본다.


Scenario population projection reflects the high probability of future realization and ease of statistical interpretation. Statistics Korea (2019) also presents the results of 30 combinations, including special scenarios, as official statistics. However, deterministic population projections provide limited information about future uncertainties with several limitations that are not probabilistic. The deterministic population projections are scenario-based estimates and show a perfect autocorrelation of three factors (birth, death, movement) of population variation over time. Therefore, international organizations UN, the Max Planck Population Research Institute (MPIDR) of Germany and the Vienna Population Research Institute (VID) of Austria have suggested stochastic based population estimates. In addition, some National Statistics Offices have also adopted this method to provide information along with the scenario results. This paper calculates the demographics of Korea based on a probabilistic or stochastic basis and then draws the pros and cons and show implications of the scenario (deterministic) population projections.

KCI등재

8베이지안 포아송 모형을 적용한 자기-대조 환자군 연구에서의 약물상호작용 위험도 분석

저자 : 이은채 ( Eunchae Leea ) , 황범석 ( Beom Seuk Hwanga )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 2호 발행 연도 : 2020 페이지 : pp. 203-213 (11 pages)

다운로드

(기관인증 필요)

초록보기

자기-대조 환자군(self-controlled case series; SCCS) 연구는 별도의 대조군 없이 환자의 비노출기간을 대조기간으로 설정하여 노출기간에 대한 상대적인 발생 위험도를 측정하는 역학 연구의 한 방법이다. 이 방법은 대조군을 선정할 때 발생하는 편의를 최소화할 수 있는 장점이 있어서 약물 복용 후 이상반응 발생 위험도를 측정하기 위한 방법으로 전통적으로 많이 사용되어왔다. 본 연구는 SCCS 연구를 바탕으로 두 개 이상의 약물을 동시에 사용했을 때 그 부작용의 위험이 어떻게 증가하는지 살펴보고자 한다. 마약성 진통제 유사체인 tramadol과 다빈도 병용 약물 간 약물상호작용에 대해 조건부 포아송 모형을 가정하고 분석하였다. 이때 베이지안 추론법을 사용하여 최대가능도추정량이 지니고 있는 과대적합 문제를 해결하며, 사전분포의 민감도를 측정하기 위해 정규 사전분포와 라플라스 사전분포를 가정하여 모형화하였다.


The self-controlled case series (SCCS) study measures the relative risk of exposure to exposure period by setting the non-exposure period of the patient as the control period without a separate control group. This method minimizes the bias that occurs when selecting a control group and is often used to measure the risk of adverse events after taking a drug. This study used SCCS to examine the increased risk of side effects when two or more drugs are used in combination. A conditional Poisson model is assumed and analyzed for drug interaction between the narcotic analgesic, tramadol and multi-frequency combination drugs. Bayesian inference is used to solve the overfitting problem of MLE and the normal or Laplace prior distributions are used to measure the sensitivity of the prior distribution.

KCI등재

9국가표준식품성분 데이터베이스 대표시료 선정을 위한 표본설계

저자 : 김진흠 ( Jinheum Kima ) , 황해원 ( Hae-won Hwanga ) , 조유정 ( Yu Jung Choa ) , 박진우 ( Jinwoo Parka )

발행기관 : 한국통계학회 간행물 : 응용통계연구 33권 2호 발행 연도 : 2020 페이지 : pp. 215-228 (14 pages)

다운로드

(기관인증 필요)

초록보기

농촌진흥청에서는 식품산업진흥법 제19조 제1항에 의거하여 국가표준식품성분표를 5년 주기로 발표하고 있다. 본 논문에서는 2021년 국가표준식품성분표 제10개정판 발간을 앞두고 우리나라 국민들이 많이 소비하고 있는 식품으로 선정된 182개 식품의 대표시료를 합리적이고 과학적으로 추출하기 위한 방안을 제안하였다. 농수산물을 포함한 식품을 판매하는 식료품점을 유통형태에 따라 대형마트와 전통시장으로 구분한 후 NFNAP에서 제안한 층화다단추출법을 각각 적용하여 8개 표본을 추출하였다. NFNAP는 미국인들이 소비하고 있는 식료품의 성분표에 대한 신뢰성 있는 추정을 담보하기 위해 미국 농무성과 국립보건원이 1977년에 협약을 맺고 공동 연구로 개발한 국가식품 영양분석 프로그램이다. 대형마트에 기초한 표본추출에서는 이마트 가양점, 홈플러스 시흥점, 롯데마트 동두천점, 이마트수원점, 롯데마트 둔산점, 롯데마트 여수점, 이마트 울산점, 하나로클럽 울산점이 표본으로 추출되었고, 전통시장에 기초한 표본추출에서는 서울시 금천구 독산동우시장과 송파구 풍납시장, 고양시 일산서구 일산시장, 광주광역시 북구 운암시장, 대전광역시 대덕구 법동시장, 부산광역시 영도구 봉래시장과 해운대구 좌동재래시장, 창원시 진해구 중앙시장이 표본으로 추출되었다.


Under Article 19, Paragraph 1 of the Food Industry Promotion Act, Rural Development Administration renews the Korean foods composition table every five years. Before the publication of the tenth revision of the Korean foods composition table in 2021, this paper suggests methods for collecting representative samples of 182 highly consumed foods in Korea. Food markets are categorized by their distribution channels, which are supermarkets and local markets. Eight samples are collected from each category by applying the National Food and Nutrient Analysis Program (NFNAP)'s stratified multi-stage sampling. The NFNAP was implemented in 1997 as a collaborative food composition research effort between the National Institute of Health (NIH) and the US Department of Agriculture (USDA) to secure reliable estimates for the nutrient content of food and beverages consumed by the US population. Selected supermarkets for selecting representative food samples are Emart Kayang, Homeplus Siheung, Lottemart Dongducheon, Emart Suwon, Lottemart Dunsan, Lottemart Yeosu, Emart Ulsan, and Hanaroclub Ulsan. Selected local markets also are Doksandongusijang in Geumcheon-gu and Pungnapsijang in Songpa-gu, Seoul, Ilsansijang in Ilsanseo-gu, Goyang, Unamsijang in Buk-gu, Gwangju, Beopdongsijang in Daedeok-gu, Daejeon, Bongnaesijang in Yeongdo-gu and Jwadongjaeraesijang in Haeundae-gu, Busan, and Jungangsijang in Jinhae-gu, Changwon.

1
권호별 보기
가장 많이 인용된 논문

(자료제공: 네이버학술정보)

가장 많이 인용된 논문
| | | |
1연안해역에서 석유오염물질의 세균학적 분해에 관한 연구

(2006)홍길동 외 1명심리학41회 피인용

다운로드

2미국의 비트코인 규제

(2006)홍길동심리학41회 피인용

다운로드

가장 많이 참고한 논문

(자료제공: 네이버학술정보)

가장 많이 참고한 논문

다운로드

2미국의 비트코인 규제

(2006)홍길동41회 피인용

다운로드

해당 간행물 관심 구독기관

조선대학교 고려대학교 연세대학교 서울대학교 이화여자대학교
 73
 67
 65
 64
 48
  • 1 조선대학교 (73건)
  • 2 고려대학교 (67건)
  • 3 연세대학교 (65건)
  • 4 서울대학교 (64건)
  • 5 이화여자대학교 (48건)
  • 6 서울시립대학교 (46건)
  • 7 부경대학교 (46건)
  • 8 중앙대학교(서울) (40건)
  • 9 성균관대학교 (38건)
  • 10 부산대학교 (37건)

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기