간행물

(사)한국빅데이터학회> 한국빅데이터학회지

한국빅데이터학회지 update

The Korean Journal of BigData

  • : (사)한국빅데이터학회
  • : 공학분야  >  산업공학
  • : KCI후보
  • :
  • : 연속간행물
  • : 반년간
  • : 2508-1829
  • :
  • :

수록정보
수록범위 : 1권1호(2016)~3권2호(2018) |수록논문 수 : 63
한국빅데이터학회지
3권2호(2018년 12월) 수록논문
최근 권호 논문
| | | |

KCI후보

1스마트 물관리를 위한 빅데이터 거버넌스 모델

저자 : 최영환 ( Young-hwan Choi ) , 조완섭 ( Wan-sup Cho ) , 이경희 ( Kyung-hee Lee )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 3권 2호 발행 연도 : 2018 페이지 : pp. 1-10 (10 pages)

다운로드

(기관인증 필요)

초록보기

스마트 물관리 분야에서도 빅데이터 분석을 통해 경쟁력을 강화하려는 요구가 급증하면서 빅데이터에 대한 체계적인 관리(거버넌스)가 중요한 이슈로 부각되고 있다. 빅데이터 거버넌스는 데이터의 품질보장, 프라이버시 보호, 데이터 수명관리, 데이터 전담조직을 통한 데이터 소유 및 관리권의 명확화 등의 데이터 관리를 평가하고(Evaluation), 지시하며(Direction), 모니터링(Monitoring) 하는 체계적인 관리활동을 의미한다. 빅데이터 거버넌스가 확립되지 못하면 중요한 의사결정에 품질이 낮은 데이터를 사용함으로써 심각한 문제를 야기할 수 있으며, 개인 프라이버시 관련 데이터로 인해 빅브라더의 우려가 현실화될 수 있고, 폭증하는 데이터의 수명관리 소홀로 인해 IT 비용이 급증하기도 한다. 이러한 기술적인 문제가 완비되더라도 데이터 관련 문제를 전담하고 책임지는 조직과 인력이 없다면 빅데이터 효과는 지속되지 못할 것이다. 본 연구에서는 빅데이터 기반의 스마트 물관리를 위한 데이터 거버넌스 구축모델을 제시하고, 실제 물관리 업무에 적용한 사례를 소개한다.


In the field of smart water management, there is an increasing demand for strengthening competitiveness through big data analysis. As a result, systematic management (Governance) of big data is becoming an important issue. Big data governance is a systematic approach to evaluating, directing and monitoring data management, such as data quality assurance, privacy protection, data lifetime management, data ownership and clarification of management rights. Failure to establish big data governance can lead to serious problems by using low quality data for critical decisions. In addition, personal privacy data can make Big Brother worry come true, and IT costs can skyrocket due to the neglect of data age management. Even if these technical problems are fixed, the big data effects will not be sustained unless there are organizations and personnel who are dedicated and responsible for data-related issues. In this paper, we propose a method of building data governance for smart water data management based on big data.

KCI후보

2머신러닝을 이용한 빅데이터 도메인 자동 판별에 관한 연구

저자 : 공성원 ( Kong Seongwon ) , 황덕열 ( Hwang Deokyoul )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 3권 2호 발행 연도 : 2018 페이지 : pp. 11-18 (8 pages)

다운로드

(기관인증 필요)

초록보기

본 연구는 빅데이터 품질 진단의 핵심 요소인 도메인 기반 품질 진단을 위한 도메인 자동 판별에 관한 연구다. 빅데이터의 가치와 활용도의 증가와 4차 산업혁명의 대두로, 법률, 의료, 금융 등 IT와 융합된 다양한 분야에서 빅데이터를 활용하여 새로운 가치를 창출하려는 노력을 진행중이다. 하지만, 신뢰도가 낮은 데이터에 기반한 분석은 과정과 결과 모두에서 치명적인 문제를 발생하며, 분석 결과에 따른 판단 또한 신뢰하기 어려워 진다. 이처럼 신뢰도가 높은 데이터의 필요성 또한 증가하였지만, 데이터의 품질 확보에 대한 연구와 그에 대한 결과는 미비하다. 본 연구는 데이터 품질 향상을 위한 진단 평가의 핵심적 요소인 도메인 기반 품질 진단에서, 수작업으로 진행되었던 도메인 판별 작업을 머신러닝을 이용하여 자동화 함으로써, 작업시간을 단축하는 것을 목표로 한다. 데이터 베이스에 저장된, 도메인이 판별되어 있는 데이터의 특성에 관한 정보들을 추출하여 변수화하고, 이를 머신러닝을 이용하여 도메인 판별을 자동화 한다. 이를 빅데이터 품질 진단에 활용하고, 품질 향상에 기여하도록 한다.


This study is a study on domain automatic classification for domain - based quality diagnosis which is a key element of big data quality diagnosis. With the increase of the value and utilization of Big Data and the rise of the Fourth Industrial Revolution, the world is making efforts to create new value by utilizing big data in various fields converged with IT such as law, medical, and finance. However, analysis based on low-reliability data results in critical problems in both the process and the result, and it is also difficult to believe that judgments based on the analysis results. Although the need of highly reliable data has also increased, research on the quality of data and its results have been insufficient. The purpose of this study is to shorten the work time to automizing the domain classification work which was performed from manually to using machine learning in the domain - based quality diagnosis, which is a key element of diagnostic evaluation for improving data quality. Extracts information about the characteristics of the data that is stored in the database and identifies the domain, and then featurize it, and automizes the domain classification using machine learning. We will use it for big data quality diagnosis and contribute to quality improvement.

KCI후보

3수입식품 빅데이터를 이용한 부적합식품 탐지 시스템에 관한 연구

저자 : 조상구 ( Cho Sanggoo ) , 최경현 ( Choi Gyunghyun )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 3권 2호 발행 연도 : 2018 페이지 : pp. 19-33 (15 pages)

다운로드

(기관인증 필요)

초록보기

FTA체결의 증가, 식품교역 증가 및 소비자의 다양한 식품 선호도 등으로 농축수산물 및 가공식품의 수입량은 매년 증가하고 있는 추세이다. 수입식품의 안전성을 확인하는 정밀검사는 전체 수입식품건수 대비 20%정도를 차지하고 계속 증가하고 있는 반면에 정부의 수입안전관리에 필요한 예산과 인력은 그 한계점에 다다르고 있다. 수입식품 안전사고가 발생하게 되면 막대한 사회적, 경제적 손실을 야기할 수 있으므로 수입식품의 수입허용여부를 정확하게 예측하여 선제 대응하는 것은 수입안전관리의 효율성과 경제성을 획기적으로 높일 수 있게 된다. 식품분야에서는 이미 엄청난 양의 정형 데이터가 과거로부터 쌓여 왔으며 이에 대한 충분한 분석을 통한 활용은 아직은 부족한 것이 현실이다. 전체 수입건수와 중량 중에서 차지하는 가공식품의 비중은 평균 75%에 달하고 있어 식품분야에서도 빅데이터의 분석, 분석기법의 적용 등으로 다량의 데이터로부터 의미 있는 정보를 추출하는 과학적이고 자동화된 부적합탐지시스템의 연구가 절실한 상황이다 이러한 배경에서 본 연구는 기계학습분야의 다양한 부적합 예측 모형을 적용하였으며 예측 모형의 정확도를 개선시키기 위한 방편으로 새로운 파생변수의 생성을 통한 데이터 전처리 방안을 제시하였다. 또한 본 연구에서는 기계학습분야의 일반적인 기저 분류기를 적용하여 예측 모형의 성능을 비교하였으며 여러 기저분류기 중 Gaussian Naïve Bayes예측 모형이 수입식품의 부적합을 탐지하여 예측하는 가장 좋은 성과를 보여주었다. 향후 Gaussian Naïve Bayes 예측 모형을 이용한 부적합 탐지 모형을 적용하여 수입식품의 정밀검사 비중을 낮추고 부적합률을 제고시킴으로써 수입안전관리 국가사무의 효율성과 수입통관의 신속성에 지대한 효과를 거둘 수 있으리라 기대한다.


Owing to the increase of FTA, food trade, and versatile preferences of consumers, food import has increased at tremendous rate every year. While the inspection check of imported food accounts for about 20% of the total food import, the budget and manpower necessary for the government's import inspection control is reaching its limit. The sudden import food accidents can cause enormous social and economic losses. Therefore, predictive system to forecast the compliance of food import with its preemptive measures will greatly improve the efficiency and effectiveness of import safety control management. There has already been a huge data accumulated from the past. The processed foods account for 75% of the total food import in the import food sector. The analysis of big data and the application of analytical techniques are also used to extract meaningful information from a large amount of data. Unfortunately, not many studies have been done regarding analyzing the import food and its implication with understanding the big data of food import. In this context, this study applied a variety of classification algorithms in the field of machine learning and suggested a data preprocessing method through the generation of new derivative variables to improve the accuracy of the model. In addition, the present study compared the performance of the predictive classification algorithms with the general base classifier. The Gaussian Naïve Bayes prediction model among various base classifiers showed the best performance to detect and predict the nonconformity of imported food. In the future, it is expected that the application of the abnormality detection model using the Gaussian Naïve Bayes. The predictive model will reduce the burdens of the inspection of import food and increase the non-conformity rate, which will have a great effect on the efficiency of the food import safety control and the speed of import customs clearance.

KCI후보

4서울 치킨집 폐업 예측 모형 개발 연구

저자 : 방준아 ( Junah Bang ) , 손광민 ( Kwangmin Son ) , 이소정 ( So Jung Ashley Lee ) , 이현근 ( Hyeongeun Lee ) , 조수빈 ( Subin Jo )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 3권 2호 발행 연도 : 2018 페이지 : pp. 35-49 (15 pages)

다운로드

(기관인증 필요)

초록보기

대한민국에서 치킨집은 전 세계 맥도날드 매장 수보다 많을 정도로 자영업의 큰 비중을 차지하는 창업업종이다. 치킨집은 꾸준히 생겨나고 있지만, 소상공인의 창업 후 폐업률은 3년 62%, 5년 71%에 육박하는 것으로 나타났다[4]. 특히, 숙박 및 음식점의 경우 70%가 3년을, 82%가 5년을 버티지 못하는 것으로 집계되었다[1]. 이에 본 연구는 '서울 치킨집 폐업 예측 모형'을 개발하여, 예비창업자가 개업 후보지를 선정하는 의사결정 과정에 도움을 주고자 하였다. 먼저 행정자치부 지방행정 인허가 데이터의 업소별 개·폐업신고 일자를 중심으로 다양한 변수를 수집하였다. 이후 다양한 분류 알고리즘을 적용하고, 예측 모형의 성능을 비교하였다. 그 결과, 인공신경망(Neural Networks)이 가장 높은 정확도를 보였지만 특이도와 민감도가 불균형적이었다. 이에 비해 유연판별분석(FDA)은 인공신경망보다 정확도는 낮지만, 상대적으로 균형적인 예측 성능을 보였다.


It seems unrealistic to say that fried chicken, often known as the American soul food, has one of the biggest markets in South Korea. Yet, South Korea owns more numbers of fried chicken restaurants than those of McDonald's franchise globally[4]. Needless to say not all these fast-food commerce survive in such small country. In this study, we propose a predictive model that could potentially help one's decision whilst deciding to open a store. We've extracted all fried chicken restaurants registered at the Korean Ministry of the Interior and Safety, then collected a number of features that seem relevant to a store's closure. After comparing the results of different algorithms, we conclude that in order to best predict a store's survival is FDA(Flexible Discriminant Analysis). While Neural Network showed the highest prediction rate, FDA showed better balanced performance considering sensitivity and specificity.

KCI후보

5랜드마크 항공 사진을 이용한 관광 경험과 색채 연관성 분석

저자 : 윤승식 ( Seungsik Yoon ) , 도진우 ( Jinwoo Do ) , 강주영 ( Juyoung Kang )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 3권 2호 발행 연도 : 2018 페이지 : pp. 51-57 (7 pages)

다운로드

(기관인증 필요)

초록보기

본 연구는 관광지를 선택할 때 중요한 관광 경험 중 시각적 요소에 해당하는 색상과 관광 경험 사이의 유효한 연관성을 찾는 것에 있다. 즉 관광지별로 대표되는 색상이 실제 관광지에 대한 경험과 관련이 있는지 찾아봄으로써, 시각적 요소 중 색채의 영향력에 대해 살펴보고자 하였다. 관광지 색상을 추출하기 위해 본 연구에서는 관광지별 랜드마크 항공 사진을 사용하였고, 기술표준원의 한국 표준색 색채 분석 도구인 KSCA를 이용하여 주요 배색을 추출하였다. 그리고 색상과 색상별 형용사 간의 관계를 매칭한 IRI image scale을 통해 관광지별 주요 색상에 대한 형용사를 추출하였다. 관광 경험은 색상을 추출한 관광지에 대한 Tripadvisor 리뷰를 분석하여 주요 키워드를 도출해 내었다. 항공 사진의 유효성 검증을 위해 Tripadvisor에서 제공하는 대표 전경 사진도 함께 분석에 활용되었다. 분석 결과 색상에서 추출된 형용사과 관광지별 리뷰주요 키워드 간의 유효한 연관성은 찾을 수 없었는데, 이는 관광지 전체의 주요 색상은 관광지 세부 경험에 비해 중요한 요인이 되지 않고 있는 것으로 판단된다. 본 연구는 색상 분석 연구와 텍스트 마이닝을 결합한 새로운 연구 방향을 제시함으로써 추후 색상을 활용한 연구에 기여하고자 하였다.


The purpose of this study is to find a valid link between color and tourism experience. We analyzed color that extracted by Aerial photo by IRI Image Scale to find color image. As an indicator of the experience of tourism, a review of the Tripadvisor was selected and analyzed through text mining. Results using text mining results and IRI image scales were generally inconsistent. To identify problems with aerial photo, the results of the analysis using the representative photographs provided by the Tripadvisor in the same way were the same as before. This indicate that details are key of tourism than the image of the overall background. This study presents new research directions by combining color analysis studies with text mining.

KCI후보

6딥러닝을 이용한 열 수요예측 모델 개발

저자 : 서한석 ( Han-seok Seo ) , 신광섭 ( Kwangsup Shin )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 3권 2호 발행 연도 : 2018 페이지 : pp. 59-70 (12 pages)

다운로드

(기관인증 필요)

초록보기

특정 지역의 고객을 대상으로 열을 공급하는 지역난방 서비스의 안정적인 운영을 위해서는 단기간의 미래수요를 보다 정확하게 예측하고, 효율적인 방법으로 생산 및 공급하는 것이 무엇보다 중요하다. 그러나 열 소비에 영향을 미치는 요소가 매우 다양할 뿐만 아니라 개별 소비자 및 지역적 특성에 따라 소비 형태가 달라지기 때문에 일반적인 상황에도 적용될 수 있는 범용적 열 수요 예측 모형을 개발하는 것은 매우 어렵다. 따라서 본 연구에서는 실시간으로 확보할 수 있는 제한적인 정보만을 바탕으로 딥러닝 기법을 활용한 수요예측 모형을 개발하고자 한다. 해당 지역의 외기온도와 날짜로만 구성된 과거 데이터를 입력 변수로 하여 텐서플로의 인공신경망을 학습시키는 방법으로 수요 예측 모형을 개발하였다. 기존의 회귀분석 기법을 통해 예측된 수요의 정확도와의 비교를 통해 제안된 모델의 성능을 평가하였다. 본 연구의 열 수요 예측 모델은 단기적 수요 예측을 위해 실시간으로 확보할 수 있는 제한적인 변수만으로도 수요 예측의 정확도를 높일 수 있음을 보였다. 나아가 개별 지역에서는 지역적 특수성을 추가하여 수요 예측 정확도를 높이는 데 활용할 수 있을 것이다.


In order to provide stable district heat supplying service to the certain limited residential area, it is the most important to forecast the short-term future demand more accurately and produce and supply heat in efficient way. However, it is very difficult to develop a universal heat demand forecasting model that can be applied to general situations because the factors affecting the heat consumption are very diverse and the consumption patterns are changed according to individual consumers and regional characteristics. In particular, considering all of the various variables that can affect heat demand does not help improve performance in terms of accuracy and versatility. Therefore, this study aims to develop a demand forecasting model using deep learning based on only limited information that can be acquired in real time. A demand forecasting model was developed by learning the artificial neural network of the Tensorflow using past data consisting only of the outdoor temperature of the area and date as input variables. The performance of the proposed model was evaluated by comparing the accuracy of demand predicted with the previous regression model. The proposed heat demand forecasting model in this research showed that it is possible to enhance the accuracy using only limited variables which can be secured in real time. For the demand forecasting in a certain region, the proposed model can be customized by adding some features which can reflect the regional characteristics.

KCI후보

7머신러닝과 샘플링을 이용한 강원도 지역 산불발생예측모형 개발

저자 : 채경재 ( Kyoung-jae Chae ) , 이유리 ( Yu-ri Lee ) , 조용주 ( Yong-ju Cho ) , 박지현 ( Ji-hyun Park )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 3권 2호 발행 연도 : 2018 페이지 : pp. 71-78 (8 pages)

다운로드

(기관인증 필요)

초록보기

본 연구는 산불 발생 예측 모형의 정확도를 높이기 위해 머신러닝 기법을 적용한 연구이다. 산불 피해 면적이 가장 큰 강원도를 중심으로 2003년부터 2016년까지 총 14년의 산불 자료를 이용하였다. 기상자료의 오차를 줄이기 위해 강원도를 9개의 구역으로 나누어 각 구역 관측소의 기상자료를 이용하였다. 9개의 구역으로 나누어 각 구역의 산불 예측 모형을 만들게 되면 산불이 발생한 날(majority)과 산불이 발생하지 않은 날(minority)의 비율 차이가 큰 불균형 문제가 발생한다. 불균형 문제에서는 모델의 성능이 떨어지는 현상이 발생할 수 있다. 이를 해결하기 위해 여러 샘플링 방법을 적용하였다. 또한 모델의 정확도를 높이기 위해 캐나다 산불 기상 지수(FWI)의 5가지 지수를 파생변수로 사용하였다. 모델링 방법은 통계적 방법인 로지스틱 회귀분석 방법과 머신러닝 방법인 random forest와 xgboost 방법을 사용하였다. 각 구역의 최종모델의 선택기준을 정확도, 민감도, 특이도를 고려하여 정했으며, 9개 구역의 예측 결과는 산불이 발생한 104건 중 80건의 발생 예측에 성공하였으며 산불이 발생하지 않은 9758건 중 7426건의 발생하지 않음을 예측했다. 전체의 정확도는 76.1%였다.


The study is based on machine learning techniques to increase the accuracy of the forest fire predictive model. It used 14 years of data from 2003 to 2016 in Gang-won-do where forest fire were the most frequent. To reduce weather data errors, Gang-won-do was divided into nine areas and weather data from each region was used. However, dividing the forest fire forecast model into nine zones would make a large difference between the date of occurrence and the date of not occurring . Imbalance issues can degrade model performance. To address this, several sampling methods were applied. To increase the accuracy of the model, five indices in the Canadian Frost Fire Weather Index (FWI) were used as derived variable. The modeling method used statistical methods for logistic regression and machine learning methods for random forest and xgboost. The selection criteria for each zone's final model were set in consideration of accuracy, sensitivity and specificity, and the prediction of the nine zones resulted in 80 of the 104 fires that occurred, and 7426 of the 9758 non-fires. Overall accuracy was 76.1%.

KCI후보

8챗봇을 이용한 Legacy 환경의 Digital Transformation

저자 : 장정호 ( Jeong-ho Jang ) , 김진수 ( Jin-soo Kim ) , 이강윤 ( Kang-yoon Lee )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 3권 2호 발행 연도 : 2018 페이지 : pp. 79-85 (7 pages)

다운로드

(기관인증 필요)

초록보기

챗봇의 활용도가 점점 커지고 AI 시장이 커지면서, 많은 기업 들이 관심을 가지고 있다. 그리고 누구나 챗봇을 만들 수 있게, 기업들이 챗봇 빌드 서비스를 제공함으로써 성장에 더욱 박차를 가하고 있다. 이렇게 쉽게 챗봇을 만들어 메신저 플랫폼에서 서비스 할 수 있게 됨으로써 기존 애플리케이션 시장에 변화가 일어나고 있다. 본 논문에서는 기존 DB 기반 애플리케이션들을 메신저 플랫폼 기반 애플리케이션으로 설계 및 구현하는 방법론을 제시하고, 실제 구현 시 고려해야 할 사항을 정리하여, 최적의 시스템 구조를 제공한다. 이러한 방법론에 따라 교육 과정에서 수강생들에게 정보를 제공하는, 교육 Advisor의 역할을 하는 챗봇을 설계 및 구현하였다. 구현한 애플리케이션은 사용자들이 원하는 정보를 사용자의 관점에서 객관화하여 대화형 인터페이스를 통해 신속하고 직관적으로 전달한다. 이러한 서비스를 구현하고, 실제 서비스해봄으로써, 앞으로 DB 기반 정보제공 애플리케이션들이 챗봇으로 구현되어 대화형 인터페이스를 통해 양방향 소통하는 방향으로 바뀔 것을 예측한다. 이러한 서비스를 구현하고, 실제 서비스해봄으로써, 앞으로 DB 기반 정보제공 애플리케이션들이 챗봇으로 구현되어 대화형 인터페이스를 통해 양방향 소통하는 방향으로 바뀔 것이다. 기업의 Legacy 애플리케이션은 인터넷과 모바일 환경으로의 전환에 이어 대화형 기반의 의사결정을 지원하는 챗봇이 Digital Transformation의 중요한 역할을 할 것이다.


As the utilization of chatbots grows and the AI market grows, many companies are interested. And everybody is spurring growth by offering chatbot build services so that they can create chatbots. This makes chatbots easier to service on the messenger platform, which is changing the existing application market. In this paper, we present a methodology for designing and implementing existing DB-based applications as instant messenger platform-based applications, and summarize what to consider in actual implementation to provide an optimal system structure. According to this methodology, we design and implement a chatbot that serves as an teaching advisor who provides information to the students in the curriculum. The implemented application objectively visualizes the user's desired information from the user's point of view and delivers it through the interactive interface quickly and intuitively. By implementing these services and real service, it is predicted that DB-based information providing applications will be implemented as chatbots and will be changed to bi-directional communication through an interactive interface. it is predicted that DB-based information providing applications will be implemented as chatbots and will be changed to bi-directional communication through an interactive interface. Enterprise legacy application will take chatbot technology as one of important digital transformation initiative.

KCI후보

9빅데이터를 활용한 공공계약의 입찰참가자수 영향요인 분석

저자 : 최태홍 ( Tae-hong Choi ) , 이경희 ( Kyung-hee Lee ) , 조완섭 ( Wan-sup Cho )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 3권 2호 발행 연도 : 2018 페이지 : pp. 87-99 (13 pages)

다운로드

(기관인증 필요)

초록보기

본 연구는 공공계약의 여러 가지 형태 중 나라장터(KONEPS)를 통해 체결된 물품구매, 용역, 시설공사 등의 계약 자료를 수집하여 공공계약에서 입찰참가자수의 영향요인을 분석한다. 공공계약에서 입찰참가자수가 중요한 이유는 경쟁성 확보를 통한 합리적 계약 체결여부를 판단하는 최소한의 기준이 될 수 있으며, 발주기관의 예산절감 또는 입찰참가자의 수익성과 밀접한 관계가 있기 때문이다.
연구 목적은 공공계약에서 입찰참여자들의 입찰참여 여부는 어떤 요인에 의해 결정되는지를 분석하여 현재 공공계약에서 입찰참여에 관한 문제점과 정책적 시사점을 제시하기 위한 것이다. 본 연구는 5만여 공공기관이 나라장터로 발주하여 30만여 개인사업자 및 법인이 참여한 435만여 물품구매, 용역, 시설공사 등 많은 계약 건을 비교·분석함으로써 기존의 샘플링 기반 연구와의 차별성을 가진다.
연구모형으로 공고일수, 예산금액, 계약방법, 낙찰방법 등을 독립변수로, 입찰참가자수를 종속변수로 각각 도출하여 활용한다. 조사 분석은 빅데이터 및 다차원 분석기법을 사용한다.
분석결과 첫째, 공공발주 사업의 예산금액의 규모가 클수록 입찰참가자수가 적고, 이는 입찰참가자들이 예산금액이 클수록 수주할 확률이 매우 낮아진다고 인지하는 것에 기인한 것으로 공공사업에 대한 신뢰성 제고를 위하여 분리발주에 대한 제도적 장치가 필요하다는 것을 의미한다. 둘째, 계약방법으로는 제한경쟁이 일반경쟁 보다 입찰참가자수가 많고, 이는 계약방법이 입찰참가자수와 공공사업의 예산절감에 영향을 줄 수 있다는 것을 의미한다. 셋째, 공고일수는 입찰참가자수에 유의미한 영향을 미치지 않았으며 이는 나라장터를 통해 많은 개인사업자 및 법인들이 입찰정보를 숙지하고 있어 정보불균형의 문제는 심각하지 않다는 것을 의미한다. 넷째, 낙찰방법으로는 적격심사낙찰제가 최저가낙찰제 보다 입찰참가자수가 많고, 이는 낙찰방법이 입찰참가자수와 입찰참가자의 수익성에 영향을 줄 수 있다는 것을 의미한다.


This study analyze the factors affecting the number of bidders in public contracts by collecting contract data such as purchase of goods, service and facility construction through KONEPS among various forms of public contracts. The reason why the number of bidders is important in public contracts is that it can be a minimum criterion for judging whether to enter into a rational contract through fair competition and is closely related to the budget reduction of the ordering organization or the profitability of the bidders.
The purpose of this study is to analyze the factors that determine the participation of bidders in public contracts and to present the problems and policy implications of bidders' participation in public contracts. This research distinguishes the existing sampling based research by analyzing and analyzing many contracts such as purchasing, service and facility construction of 4.35 million items in which 50,000 public institutions have been placed as national markets and 300,000 individual companies and corporations participated.
As a research model, the number of announcement days, budget amount, contract method and winning bid is used as independent variables and the number of bidders is used as a dependent variable. Big data and multidimensional analysis techniques are used for survey analysis.
The conclusions are as follows: First, the larger the budget amount of public works projects, the smaller the number of participants. Second, in the contract method, restricted competition has more participants than general competition. Third, the duration of bidding notice did not significantly affect the number of bidders. Fourth, in the winning bid method, the qualification examination bidding system has more bidders than the lowest bidding system.

KCI후보

10기계학습을 활용한 데이터 기반 경찰신고건수 예측

저자 : 최재훈 ( Jaehun Choi )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 3권 2호 발행 연도 : 2018 페이지 : pp. 101-112 (12 pages)

다운로드

(기관인증 필요)

초록보기

본 연구는 기계학습의 하나인 신경망 분석과 음이항 회귀분석을 활용하여 경찰신고건수를 예측하고자 2016년 6월부터 2017년 5월까지 충남지방경찰청에 접수된 112신고 데이터를 이용하여 예측모델을 개발하였다. 모델을 개발하기 위해 경찰신고건수에 영향을 줄 수 있는 시간, 휴일, 휴일 전날, 계절, 기온, 강수량, 풍속, 관할면적, 인구, 외국인 수, 단독주택비율, 기타주택비율 변수 등을 활용하였다. 변수의 종류에 따라 몇몇은 경찰신고건수와 양의 상관관계 또는 음의 상관관계가 확인되었다. 사용된 두 개의 방법론을 비교한바, 신경망분석의 예측 결과는 예측 값과 실제 값의 상관계수 0.7702, RMSE 2.557이고, 음이항 회귀분석은 상관계수 0.7158, RMSE 2.831으로 나타났다. 신경망분석은 해석가능성은 낮지만, 음이항 회귀분석에 비해 예측력이 뛰어나다는 것이 확인되었다. 향후 경찰관서에서 본 연구의 예측모델을 기초로 하여 최적의 경찰력 배치를 할 수 있을 것으로 기대된다.


The purpose of the study is to predict the number of police calls using neural network which is one of the machine learning and negative binomial regression, by using the data of 112 police calls received from Chungnam Provincial Police Agency from June 2016 to May 2017. The variables which may affect the police calls have been selected for developing the prediction model : time, holiday, the day before holiday, season, temperature, precipitation, wind speed, jurisdictional area, population, the number of foreigners, single house rate and other house rate. Some variables show positive correlation, and others negative one. The comparison of the methods can be summarized as follows. Neural network has correlation coefficient of 0.7702 between predicted and actual values with RMSE 2.557. Negative binomial regression on the other hand shows correlation coefficient of 0.7158 with RMSE 2.831. Neural network has low interpretability, but an excellent predictability compared with the negative binomial regression. Based on the prediction model, the police agency can do the optimal manpower allocation for given values in the selected variables.

12
권호별 보기
가장 많이 인용된 논문

(자료제공: 네이버학술정보)

가장 많이 인용된 논문
| | | |
1연안해역에서 석유오염물질의 세균학적 분해에 관한 연구

(2006)홍길동 외 1명심리학41회 피인용

다운로드

2미국의 비트코인 규제

(2006)홍길동심리학41회 피인용

다운로드

가장 많이 참고한 논문

(자료제공: 네이버학술정보)

가장 많이 참고한 논문

다운로드

2미국의 비트코인 규제

(2006)홍길동41회 피인용

다운로드

해당 간행물 관심 구독기관

계명대학교 군산대학교 배재대학교 연세대학교 경희대학교
 18
 17
 16
 13
 11
  • 1 계명대학교 (18건)
  • 2 군산대학교 (17건)
  • 3 배재대학교 (16건)
  • 4 연세대학교 (13건)
  • 5 경희대학교 (11건)
  • 6 가천대학교 (9건)
  • 7 충북대학교 (7건)
  • 8 고려대학교 (7건)
  • 9 서울대학교 (7건)
  • 10 경북대학교 (7건)

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기