논문 상세보기

(사)한국빅데이터학회> 한국빅데이터학회지> 스마트시티 IoT 품질 지표 개발 및 우선순위 도출

KCI후보

스마트시티 IoT 품질 지표 개발 및 우선순위 도출

Development of Smart City IoT Data Quality Indicators and Prioritization Focusing on Structured Sensing Data

양현모 ( Hyun-mo Yang ) , 한규보 ( Kyu-Bo Han ) , 이정훈 ( Jung Hoon Lee )
  • : (사)한국빅데이터학회
  • : 한국빅데이터학회지 6권1호
  • : 연속간행물
  • : 2021년 08월
  • : 161-178(18pages)
한국빅데이터학회지

DOI


목차

Ⅰ. 서 론
Ⅱ. 이론적 배경
Ⅲ. 연구문제 및 방법
Ⅳ. 분석 결과
Ⅴ. 결론
참 고 문 헌

키워드 보기


초록 보기

‘빅데이터’는 ‘21세기 원유’로 비유될 만큼 그 중요성이 증대되고 있다. 스마트시티에서 생성 및 수집되는 IoT 데이터의 경우 데이터의 품질이 공공서비스의 품질과 연관되므로 품질관리에 주의를 기울여야 한다. 그러나 ISO/IEC 기관 및 국내/외 여러 기관을 통해 제시된 데이터 품질 지표는 ‘사용자’ 중심에 한정되어 있다는 한계점을 지닌다. 본 연구는 이러한 한계점을 보완하기 위해 공급자 중심의 지표와 그 우선순위를 도출하였다. 공급자 중심의 스마트시티 IoT 데이터 품질 평가지표 3개의 카테고리와 13개의 지표를 도출한 후 AHP 분석을 통하여 지표 카테고리와 데이터 품질 지표의 우선순위를 도출하였고 각 지표의 타당성을 조사하였다. 해당 연구를 통해 센서 데이터를 수집하고 취합하여 전달하는 직무를 수행하는 개인 혹은 기업에게 데이터가 지녀야 하는 기본적인 요건을 제시함으로써 센서 데이터 품질 향상에 기여할 수 있다. 또한 지표 우선순위를 기반으로 데이터 품질관리를 수행하여 품질관리 업무 효율의 향상을 제공할 수 있다.
The importance of ‘Big Data’ is increasing to the point that it is likened to ‘21st century crude oil’. For smart city IoT data, attention should be paid to quality control as the quality of data is associated with the quality of public services. However, data quality indicators presented through ISO/IEC organizations and domestic/foreign organizations are limited to the ‘User’ perspective. To complement these limitations, the study derives supplier-centric indicators and their priorities. After deriving 3 categories and 13 indicators of supplier-oriented smart city IoT data quality evaluation indicators, we derived the priority of indicator categories and data quality indicators through AHP analysis and investigated the feasibility of each indicator. The study can contribute to improving sensor data quality by presenting the basic requirements that data should have to individuals or companies performing the task. Furthermore, data quality control can be performed based on indicator priorities to provide improvements in quality control task efficiency.

UCI(KEPA)

I410-ECN-0102-2022-500-000751212

간행물정보

  • : 공학분야  > 산업공학
  • : KCI후보
  • :
  • : 반년간
  • : 2508-1829
  • : 2713-6361
  • : 학술지
  • : 연속간행물
  • : 2016-2022
  • : 179


저작권 안내

한국학술정보㈜의 모든 학술 자료는 각 학회 및 기관과 저작권 계약을 통해 제공하고 있습니다.

이에 본 자료를 상업적 이용, 무단 배포 등 불법적으로 이용할 시에는 저작권법 및 관계법령에 따른 책임을 질 수 있습니다.

7권1호(2022년 06월) 수록논문
최근 권호 논문
| | | |

KCI후보

1분산 인공지능 학습 기반 작업증명 합의알고리즘

저자 : 채원부 , 박종서

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 7권 1호 발행 연도 : 2022 페이지 : pp. 1-14 (14 pages)

다운로드

(기관인증 필요)

초록보기

대부분의 블록체인이 사용하는 작업증명 합의 알고리즘은 채굴이라는 형태로 대규모의 컴퓨팅리소스 낭비를 초래하고 있다. 작업증명의 컴퓨팅리소스 낭비를 줄이기 위해 유용한 작업증명 합의 알고리즘이 연구 되었으나 여전히 블록 생성 시 리소스 낭비와 채굴의 중앙화 문제가 존재한다.
본 논문에서는 블록생성을 위한 상대적으로 비효율적인 연산 과정을 분산 인공지능 모델 학습으로 대체하여 블록생성 시 리소스 낭비문제를 해결하였다. 또한 학습 과정에 참여한 노드들에게 공평한 보상을 제공함으로써 컴퓨팅파워가 약한 노드의 참여 동기를 부여했고, 기존 중앙 집중 인공지능 학습 방식에 근사한 성능은 유지하였다.
제안된 방법론의 타당성을 보이기 위해 분산 인공지능 학습이 가능한 블록체인 네트워크를 구현하여 리소스 검증을 통한 보상 분배를 실험 하였고, 기존 중앙 학습 방식과 블록체인 분산 인공지능 학습 방식의 결과를 비교하였다. 또한 향후 연구로 블록체인 메인넷과 인공지능 모델 확장 시 발생 할 수 있는 문제점과 개발 방향성을 제시함으로서 논문을 마무리 하였다.


The proof-of-work consensus algorithm used by most blockchains is causing a massive waste of computing resources in the form of mining. A useful proof-of-work consensus algorithm has been studied to reduce the waste of computing resources in proof-of-work, but there are still resource waste and mining centralization problems when creating blocks. In this paper, the problem of resource waste in block generation was solved by replacing the relatively inefficient computation process for block generation with distributed artificial intelligence model learning. In addition, by providing fair rewards to nodes participating in the learning process, nodes with weak computing power were motivated to participate, and performance similar to the existing centralized AI learning method was maintained.
To show the validity of the proposed methodology, we implemented a blockchain network capable of distributed AI learning and experimented with reward distribution through resource verification, and compared the results of the existing centralized learning method and the blockchain distributed AI learning method. In addition, as a future study, the thesis was concluded by suggesting problems and development directions that may occur when expanding the blockchain main network and artificial intelligence model.

KCI후보

2IoT 기반 교통사고 실시간 인지방법론 연구

저자 : 오성훈 , 전영준 , 권영우 , 정석찬

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 7권 1호 발행 연도 : 2022 페이지 : pp. 15-27 (13 pages)

다운로드

(기관인증 필요)

초록보기

최근 5년간 차량 단독사고 교통사고 치사율이 전체 사고보다 4.7배 높은 것으로 집계되고 있으며, 차량 단독사고를 즉각적으로 감지하고 대응할 수 있는 시스템 구축이 필요하다. 본 연구는 가드레일에 충격과 차량 진입 감지 IoT(Internet of Thing) 센서를 부착하여 가드레일 충격 발생 시 사고 현장의 영상을 인공지능 기술을 통해 분석하고 구조기관에 전송하여 빠른 구조작업을 수행하여 피해를 최소화 시킬 수 있는 방법론을 제시한다. 해당 구간 내 차량 진입과 가드레일 충격 감지를 위한 IoT 센서 모듈과 차량 이미지 데이터 학습을 통한 인공지능 기반 객체 탐지 모듈을 구현하였다. 그리고, 센서 정보와 영상 데이터 등을 통합적으로 관리하는 모니터링 및 운영 모듈도 구현하였다. 시스템 유효성 검증을 위하여 충격 감지 전송속도와 자동차 및 사람 객체 탐지 정확도, 센서 장애감지 정확도를 측정한 결과, 모두 목표치를 충족하였다. 향후에는 실제 도로에 적용하여 실데이터를 적용한 유효성을 검증하고 상용화할 계획이다. 본 시스템은 도로 안전 향상에 이바지할 것이다.


In the past five years, the fatality rate of single-vehicle accidents has been 4.7 times higher than that of all accidents, so it is necessary to establish a system that can detect and respond to single-vehicle accidents immediately. The IoT(Internet of Thing)-based real-time traffic accident recognition system proposed in this study is as following. By attaching an IoT sensor which detects the impact and vehicle ingress to the guardrail, when an impact occurs to the guardrail, the image of the accident site is analyzed through artificial intelligence technology and transmitted to a rescue organization to perform quick rescue operations to damage minimization. An IoT sensor module that recognizes vehicles entering the monitoring area and detects the impact of a guardrail and an AI-based object detection module based on vehicle image data learning were implemented. In addition, a monitoring and operation module that imanages sensor information and image data in integrate was also implemented. For the validation of the system, it was confirmed that the target values were all met by measuring the shock detection transmission speed, the object detection accuracy of vehicles and people, and the sensor failure detection accuracy. In the future, we plan to apply it to actual roads to verify the validity using real data and to commercialize it. This system will contribute to improving road safety.

KCI후보

3정신건강 위험 예측 및 관리를 위한 멘탈 헬스케어 디지털 트윈 기술 연구

저자 : 양세모 , 이강윤

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 7권 1호 발행 연도 : 2022 페이지 : pp. 29-36 (8 pages)

다운로드

(기관인증 필요)

초록보기

감정 노동 및 서비스업 종사자의 급격한 증가에 따른 감정노동자의 스트레스 및 우울증 유병률이 증가하고 있다. 하지만, 현재 감정노동자의 정신건강 관리는 스트레스 상황 당시의 정서반응을 고려하기 어렵고 개인의 기저 상태가 반영되지 않아 기존 정신건강 관리의 한계가 존재한다. 본 연구에서는 개인 맞춤형 스트레스 위험 관리 솔루션인 멘탈 헬스케어 디지털 트윈 솔루션 기술을 제시한다. 감정노동으로 인한 정신건강 위험 관리를 위해, 정서/신체반응 및 환경 등의 개인별 스트레스 위험요인을 다양한 모달리티로 추출하고 가상 공간에서 동적 객체의 동기화/모델링을 통하여 스트레스 위험도를 정밀 예측하는 솔루션 탐색 시뮬레이션을 수행한다. 사용자에게 맞는 인터벤션을 제공하여, 감정노동자의 환경에 맞게 모달리티와 객체의 구성이 가능하고 사용자의 피드백에 따라 개선 가능한 개인 맞춤형 정신건강 위험 예측을 위한 멘탈 헬스케어 디지털 트윈 솔루션을 제공한다.


The prevalence of stress and depression among emotional workers is increasing due to the rapid increase in emotional labor and service workers. However, the current mental health management of emotional workers is difficult to consider the emotional response at the time of stress situations, and the existing mental health management is limited because the individual's base state is not reflected. In this study, we present mental healthcare digital twin solution technology, a personalized stress risk management solution. For mental health risk management due to emotional labor, a solution simulation is performed to accurately predict stress risk through synchronization/modeling of dynamic objects in virtual space by extracting individual stress risk factors such as emotional/physical response and environment into various modalities. It provides a mental healthcare digital twin solution for predicting personalized mental health risks that can be configured with modalities and objects tailored to the environment of emotional workers and improved according to user feedback.

KCI후보

4스마트 자율배송을 위한 클래스 분류와 객체별 학습데이터 유형

저자 : 강영진 , 김기환 , 정석찬

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 7권 1호 발행 연도 : 2022 페이지 : pp. 37-47 (11 pages)

다운로드

(기관인증 필요)

초록보기

자율배송 운행 데이터는 코로나 시대의 라스트마일 배송에 대한 패러다임 변화를 주도하는 핵심이다. 국내 자율배송로봇과 해외 기술선도국가 간의 기술격차 해소를 위해서는 인공지능 학습에 사용 가능한 대규모 데이터 수집과 검증이 최우선으로 요구된다. 따라서 해외 기술선도국가에서는 인공지능 학습데이터를 누구든 사용가능한 공공데이터 형태로 오픈하여 검증과 기술발전에 기여하고 있다. 본 논문은 자율배송로봇 학습을 목적으로 326개의 객체를 수집하고 Mask r-cnn, Yolo v3 등의 인공지능 모델을 학습하고 검증하였다. 추가적으로 두 모델을 기반으로 비교하고 향후 자율배송로봇 연구에 요구되는 요소를 고찰하였다.


Autonomous delivery operation data is the key to driving a paradigm shift for last-mile delivery in the Corona era. To bridge the technological gap between domestic autonomous delivery robots and overseas technology-leading countries, large-scale data collection and verification that can be used for artificial intelligence training is required as the top priority. Therefore, overseas technology-leading countries are contributing to verification and technological development by opening AI training data in public data that anyone can use. In this paper, 326 objects were collected to trainn autonomous delivery robots, and artificial intelligence models such as Mask r-CNN and Yolo v3 were trained and verified. In addition, the two models were compared based on comparison and the elements required for future autonomous delivery robot research were considered.

KCI후보

5한국프로야구에서 장타율과 출루율(OPS) 예측 연구

저자 : 신동윤 , 김진호

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 7권 1호 발행 연도 : 2022 페이지 : pp. 49-61 (13 pages)

다운로드

(기관인증 필요)

초록보기

스포츠 분야에서는 팀 전략 구상과 마케팅 등 팀 운영에 있어서, 데이터 분석의 비중이 점점 더 커지고 있다. 특히, 한국프로야구에서는 한 시즌이 끝나면 FA, 트레이드 등 다음 해 팀 전략을 구상하기 위해서 선수 영입과 선수 육성 등의 계획을 수립하는데, 이 때 선수들의 다음 해 성적을 예측하는 것이 매우 중요하다. 본 연구에서는 타자만으로 대상을 한정지어 다음 해의 성적이 상승할지를 예측해보고자 하였다. 상승 및 하락의 기준이 되는 기록으로는, 계산하기 쉽고 팀 득점과의 관계가 높은 OPS로 하였다. 본 연구에서 데이터는 한국프로야구 1982년부터 2021년까지 40년간의 정규시즌 데이터를 사용하였고, 실험 방법으로는 11개의 머신러닝 분류 모델을 사용하였다. OPS의 상승 및 하락 여부를 예측해본 결과, RBF SVM, Neural Net, Gaussian Process, AdaBoost가 다른 분류 모델에 비해 정확도가 높게 나왔고 나이는 정확도에 큰 영향을 주지 못했다.


In sports, the proportion of data analysis in team management such as team strategy planning and marketing is increasing. In KBO(Korea Baseball Organization) league, in particular, plans such as recruiting players and fostering players are established to devise team strategies for the next year, such as FA and trade, at the end of a season. For these reasons, it is very important to predict players' performance for the next year. In this study, the target was limited to only the batter and tried to find out how to predict whether the performance of the next year will improve. As a standard record for rising and falling, OPS(On-Base Plus Slugging), which is easy to calculate and has a high relationship with team score, was used. In this study, 40 years of regular season data from 1982 to 2021 were used as data, and 11 machine learning classification models were used as experimental methods. Predicting the rise and fall of OPS, RBF SVM, Neural Net, Gaussian Process, and AdaBoost were more accurate than other classification models, and age did not significantly affect accuracy.

KCI후보

6YOLOv5를 이용한 임베디드 마스크 인식 시스템

저자 : 유가원 , 최은성 , 강영진 , 전영준 , 정석찬

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 7권 1호 발행 연도 : 2022 페이지 : pp. 63-73 (11 pages)

다운로드

(기관인증 필요)

초록보기

2020년부터 현재까지 COVID-19가 지속되고 있으며, 사회적으로도 많은 변화가 생겼다. 마스크를 착용하는 것은 필수가 되었고, 마스크 미착용 시, 공공시설이나 식당 등을 이용할 수 없게 되었다. 이로 인해 대부분의 공공시설 출입구에서는 마스크 인식 시스템을 구비하여 마스크 착용 여부를 확인하고 있다. 그러나 목도리로 입을 가린 사람이나 마스크를 제대로 착용하지 않은 사람 등에 대한 판별 여부가 불분명하다. 본 연구에서는 YOLOv5를 이용한 임베디드 마스크 인식 시스템을 제안하였다. 기존 마스크 인식 시스템과는 달리 마스크 착용 여부뿐만 아니라 목도리를 입으로 가린 사람, 손으로 입을 가린 사람 등 다양한 예외 상황에서도 마스크 착용 여부를 구별해낼 수 있었으며, Nvida Jetson Nano Board에 탑재하였을 때 우수한 성능을 보였다.


COVID-19 has continued from 2020 to the present, and many social changes have occurred. Wearing a mask has become mandatory, and if you do not wear a mask, you cannot use public facilities or restaurants. For this reason, most public facility entrances are equipped with a mask recognition system to check whether a mask is worn. However, it is unclear whether people who cover their mouths with a scarf or who do not wear a mask properly can be identified. In this study, we proposed an embedded mask recognition system using YOLOv5. Unlike the existing mask recognition system, it was able to distinguish not only whether a mask was worn, but also whether a mask was worn in various exceptional situations, such as a person with a scarf or a person covering their mouth with their hands, and showed excellent performance when mounted on the Nvida Jetson Nano Board.

KCI후보

7시뮬레이션 기반 유전알고리즘을 이용한 디스패칭 연구: 재작업이 존재하는 유연흐름라인을 대상으로

저자 : 이광헌 , 한광욱 , 강봉권 , 이승환 , 홍순도

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 7권 1호 발행 연도 : 2022 페이지 : pp. 75-87 (13 pages)

다운로드

(기관인증 필요)

초록보기

재작업은 제품의 품질 만족을 위해 요구되는 활동으로 제조 현장에서 필수적인 공정이다. 사전에 수행 여부의 파악이 어려운 재작업은 공정시간의 증가 및 제품의 납기 지연으로 이어질 수 있어 이를 고려한 스케줄링이 중요하다. 본 연구에서는 자동차 배관 생산라인인 재작업이 존재하는 유연흐름라인을 대상으로 Dispatching을 통한 평균 흐름시간과 납기지연의 가중합을 최소화하는 스케줄링 연구를 진행하였다. 본 연구에서는 제품별 납기 등 고객 요구와 재작업 및 가공시간 등의 변동성이 존재하는 제조환경에서 Dispatching을 위한 가중치 기반 Dispatching 규칙(WDR)을 제안한다. WDR은 여러 단일 Dispatching 규칙의 가중합으로 구성되며 본 연구는 가중치 탐색을 위해 시뮬레이션 기반 유전알고리즘을 적용하였다. 시뮬레이션 실험을 통해 WDR이 단일 Dispatching 규칙에 비해 우수한 성능을 보임을 확인하였다.


This study investigates a dynamic flexible flow shop scheduling problem under uncertain rework operations for an automobile pipe production line. We propose a weighted dispatching rule (WDR) based on the multiple dispatching rules to minimize the weighted sum of average flowtime and tardiness. The set of weights in WDR should be carefully determined because it significantly affects the performance measures. We build a discrete-event simulation model and propose a genetic algorithm to optimize the set of weights considering complex and variant operations. The simulation experiments demonstrate that WDR outperforms the baseline dispatching rules in average flowtime and tardiness.

KCI후보

8밀도기반 선박 도메인을 이용한 안전 성능 지표 활용성 연구

저자 : 한영재 , 심성현 , 배혜림

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 7권 1호 발행 연도 : 2022 페이지 : pp. 89-97 (9 pages)

다운로드

(기관인증 필요)

초록보기

선박 충돌 사고는 경제적 손실, 인명피해 등 다양한 부정적 상황을 초래할 수 있기 때문에 사고를 예방하기 위한 다각적인 노력이 필요하다. 따라서 사고 예방을 위한 연구가 활발히 이루어지고 있으며, 본 연구에서는 선박 충돌 사고 예방을 위한 새로운 선행 지표를 제안한다. 기존 연구에서는 특정 해역에서 선박들간의 거리를 고려하여 충돌위험을 표현하였지만 이를 다른 해역에 적용하기 위해서는 모델을 새로 개발해야하는 단점이 존재한다. 본 연구에서는 선박 운항 정보인 AIS(Automatic Identification System) 데이터를 활용하여 해역의 환경과 운항의 특징을 포함한 밀도기반 선박 도메인 DESD(Density based Empirical Ship Domain)을 정의하였다. 각 해역별로 만들어진 2차원의 DESD를 대상으로 Deep Clustering을 적용하여 유사한 운항 환경을 가진 해역들을 군집화 한다. 군집화된 해역과 선박 충돌 사고의 연관성 분석을 통해 해역의 특징별로 사고의 발생여부가 달라짐을 통계적으로 검정하여 DESD가 사고의 선행 지표로서 활용될 수 있음을 증명하였다.


Various efforts are needed to prevent accidents because ship collisions can cause various negative situations such as economic losses and casualties. Therefore, research to prevent accidents is being actively conducted, and in this study, new leading indicators for preventing ship collision accidents is proposed. In previous studies, the risk of collision was expressed in consideration of the distance between ships in a specific sea area, but there is a disadvantage that a new model needs to be developed to apply this to other sea areas. In this study, the density-based ship domain DESD (Density-based Empirical Ship Domain) including the environment and operating characteristics of the sea area was defined using AIS (Automatic Identification System) data, which is ship operation information. Deep clustering is applied to two-dimensional DESDs created for each sea area to cluster the seas with similar operating environments. Through the analysis of the relationship between clustered sea areas and ship collision accidents, it was statistically tested that the occurrence of accidents varies by characteristic of each sea area, and it was proved that DESD can be used as a leading indicator of accidents.

KCI후보

9건설기계 조립라인의 동영상 기반 시뮬레이션 입력 모델링 절차 연구

저자 : 김호영 , 이태훈 , 강봉권 , 이주호 ( Ju-Ho Lee ) , 홍순도

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 7권 1호 발행 연도 : 2022 페이지 : pp. 99-111 (13 pages)

다운로드

(기관인증 필요)

초록보기

불확실성과 복잡성이 존재하는 제조시스템의 생산성 분석과 의사결정을 위하여 시뮬레이션 기법이 활용될 수 있다. 이러한 시스템의 시뮬레이션을 위해 대상의 특성을 반영하는 입력 모델링 과정이 필요하다. 하지만 건설기계 조립라인과 같은 수작업 중심과 긴 리드타임을 가지는 복잡한 환경에서는 시뮬레이션에 활용할 데이터의 수집이 제한된다. 본 연구는 입력 데이터의 수집이 어려운 환경에서 동영상 데이터를 이용한 시뮬레이션 입력 모델링 절차를 제안한다. 동영상 데이터 기반 작업분석을 통해 측정시간을 정미시간과 표준시간으로 산정하고, 시뮬레이션의 입력 분포로 활용할 수 있다. 제안하는 절차로 산정된 확률분포를 시뮬레이션에 이용하여 대상 시스템의 주요 생산성 지표를 분석하였다. 본 연구에서 제안하는 절차는 데이터가 적은 상황에서 시뮬레이션을 활용한 생산성 분석으로 의사결정 보조에 도움을 줄 것으로 기대된다.


A simulation technique can be used to analyze performance measures and support decision makings in manufacturing systems considering operational uncertainty and complexity. The simulation requires an input modeling procedure to reflect the target system's characteristics. However, data collection to build a simulation is quite limited when a target system includes manual productions with a lot of operational time such as construction equipment assembly lines. This study proposes a procedure for simulation input modeling using video data when it is difficult to collect enough input data to fit a probability distribution. We conducted a video-data analysis and specify input distributions for the simulation. Based on the proposed procedure, simulation experiments were conducted to evaluate key performance measures of the target system. We also expect that the proposed procedure may help simulation-based decision makings when obtaining input data for a simulation modeling is quite challenging.

KCI후보

10데이터센터 장애 예방을 위한 인프라 이상징후 분석: RRCF와 Prophet Ensemble 분석 기반

저자 : 신현종 , 김성근 , 천병환 , 진경복 , 양승정

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 7권 1호 발행 연도 : 2022 페이지 : pp. 113-124 (12 pages)

다운로드

(기관인증 필요)

초록보기

데이터센터의 장애 예방을 위해 머신러닝과 빅데이터를 활용한 다양한 방법들이 적용되어 왔다. 그러나 개별 장비 기반의 성능지표를 참조하거나, 인프라 운영환경을 고려하지 않은 접근방법으로 실제 활용되는 데에는 많은 한계가 있었다. 이에 본 연구에서는 개별 인프라 장비들의 성능지표를 통합 모니터링하며, 다양한 장비들의 성능지표를 구간화, 등급화 하여 단일수치화를 진행한다. 인프라 운영에 대한 경험치 기반으로 데이터 전처리를 수행하며, RRCF(Robust Random Cut Forest)분석과 Prophet 분석 모델을 앙상블하여 이상징후 검출에 신뢰도 있는 분석결과를 도출하였다. 데이터센터 내 운영담당자들의 접근을 용이하게 하기 위해 장애분석시스템을 구현하여 데이터센터 장애의 선제 대응과 적정한 튜닝시점을 제시할 수 있다.


Various methods using machine learning and big data have been applied to prevent failures in Data Centers. However, there are many limitations to referencing individual equipment-based performance indicators or to being practically utilized as an approach that does not consider the infrastructure operating environment. In this study, the performance indicators of individual infrastructure equipment are integrated monitoring and the performance indicators of various equipment are segmented and graded to make a single numerical value. Data pre-processing based on experience in infrastructure operation. And an ensemble of RRCF (Robust Random Cut Forest) analysis and Prophet analysis model led to reliable analysis results in detecting anomalies. A failure analysis system was implemented to facilitate the use of Data Center operators. It can provide a preemptive response to Data Center failures and an appropriate tuning time.

12
권호별 보기
같은 권호 다른 논문
| | | | 다운로드

KCI후보

1사회연결망 분석을 활용한 고속도로 유휴부지의 물류센터 활용 방안에 관한 연구

저자 : 공인택 ( Intaek Gong ) , 신광섭 ( Kwangsup Shin )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 6권 1호 발행 연도 : 2021 페이지 : pp. 1-12 (12 pages)

다운로드

(기관인증 필요)

초록보기

모바일 기반 온라인 쇼핑의 급성장과 COVID-19로 인해 시작된 비대면 비즈니스의 성장은 택배와 같은 물류 서비스 수요를 폭발적인 증가를 이끌어냈다. 급격하게 성장한 수요에 대응하기 위해 대부분의 물류·유통기업들은 도심 내 풀필먼트 센터 구축을 통한 고객 서비스 수준 향상을 위해 노력하고 있다. 그러나, 높은 지가와 교통 체증 등과 같은 사회적 요인에 의해 도심 내 풀필먼트 센터를 확보하는 데 큰 어려움을 겪고 있다. 본 연구에서는 향후 고속도로에 스마트톨링 서비스가 전면 확대됨에 따라 유휴부지로 전환될 요금소 부지를 공유물류센터로 전환하기 위한 후보지 선정 방안을 제시한다. 이를 위해 사회연결망 분석을 통해 각 후보지들의 중심성을 분석하였으며, 중심성 평가의 특성에 따른 결과의 해석을 위한 네트워크 구조를 거리기반과 시간기반의 두 가지 방법으로 재설계하여 평가하였다. 누적된 중요도를 기준으로 적정 후보지 군을 선택하는데 활용될 수 있을 것이다.

KCI후보

2기업 데이터 전략과 투자를 위한 빅데이터 성숙도 평가 프레임워크 실증 연구

저자 : 김옥기 ( Okki Kim ) , 박정 ( Jung Park ) , 조완섭 ( Wan-sup Cho )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 6권 1호 발행 연도 : 2021 페이지 : pp. 13-22 (10 pages)

다운로드

(기관인증 필요)

초록보기

본 연구의 목적은 기업의 효과적인 데이터 전략 수립과 효율적 투자를 위해 빅데이터 성숙도를 평가하기 위한 프레임워크를 개발하고 이를 실증하는데 있다. 이를 위해 현재까지 개발된 평가의 단점을 보완하여, 기업의 빅데이터 성숙도를 프로세스 통합적으로 평가할 수 있는 프레임워크를 개발하였다. 그 결과 '비전과 전략', '관리', '분석', '활용'의 4가지 평가 영역과 각 영역별 평가항목, 세부내용 및 단계별 준거를 도출하였다. 이를 기업인 설문을 통해 실증하였으며 국내 기업의 빅데이터 성숙도를 진단하였다. 향후 연구방향으로 산업별 특성에 따른 세부 평가요소 개발, 평가 결과에 따른 데이터 활용 프레임워크의 발전, 검증 대상의 조정을 통한 추가적인 타당성 및 신뢰도 향상을 제안하였다.

KCI후보

3제조 설비 이상탐지를 위한 지도학습 및 비지도학습 모델 설계에 관한 연구

저자 : 오민지 ( Min-ji Oh ) , 최은선 ( Eun-seon Choi ) , 노경우 ( Kyung-woo Roh ) , 김재성 ( Jae-sung Kim ) , 조완섭 ( Wan-sup Cho )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 6권 1호 발행 연도 : 2021 페이지 : pp. 23-35 (13 pages)

다운로드

(기관인증 필요)

초록보기

제4차 산업혁명 선언 이후 생산 제조 기술과 정보통신기술(ICT)이 융합된 스마트 팩토리가 큰 주목을 받고 사물인터넷(IoT) 기술 및 빅데이터 기술 등이 발전하면서 생산 시스템의 자동화가 가능해졌다. 고도화된 제조 산업에서 생산 시스템에는 예정되지 않은 성능 저하 및 가동 중지 발생 가능성이 존재하며, 가능한 한 빨리 잠재적인 오류를 감지하여 이를 복구해 안전 위험을 줄여나가야 한다는 요구가 있다. 본 연구는 유압 시스템에 부착된 다중 센서 데이터를 기반으로 장비의 고장 예측과 이상 발생 시점 예측을 결합하여 제조 설비 이상탐지를 위한 지도학습 및 비지도학습 모델을 설계한다. 지도학습 분석 방법으로 XGBoost, LightGBM, CNN 모델의 정확도를 비교하였다. 혼동행렬 기반의 평가지표를 통해 LightGBM의 예측력이 97%로 가장 우수한 것을 확인하였다. 또한 비지도 학습 분석 방법으로 MD, AE, LSTM-AE 모델을 구축하여 각 모델을 비교 분석한 결과 LSTM-AE 모델이 이상패턴을 75% 감지하여 가장 우수한 성능을 보였다. 본 연구는 지도학습과 비지도학습 기법을 종합하여 설비의 고장여부를 정확하게 진단하고 이상상황이 발생하는 시점을 예측함으로써 이상상황에 대한 선제대응을 할 수 있는 기반을 마련하여 스마트 팩토리 고도화에 기여하고자 한다.

KCI후보

4인공지능(AI) 기반 치매 조기진단 방법론에 관한 연구

저자 : 오성훈 ( Oh Sung Hoon ) , 전영준 ( Jeon Young Jun ) , 권영우 ( Kwon Young Woo ) , 정석찬 ( Jeong Seok Chan )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 6권 1호 발행 연도 : 2021 페이지 : pp. 37-49 (13 pages)

다운로드

(기관인증 필요)

초록보기

한국의 치매 환자 수는 80만명 이상으로 추정되고 있으며, 치매의 심각성은 사회적 문제로 되고 있다. 하지만 전 세계적으로 치매를 완치할 수 있는 치료법도 약물도 아직 개발되지 못하고 있으며, 향후 급격한 고령화 추세로 인해 치매 환자 수는 더욱 증가할 전망이다. 현재로서는 치매를 조기에 발견하여 치매 증상의 경과를 늦추는 것이 최적의 대안이라 할 수 있다. 본 연구에서는 망막 내 치매를 가장 명확하게 조기 진단할 수 있는 중요 단백질인 아밀로이드 플라크를 AI 기반의 영상분석을 통해 측정하고 분석하여 치매를 조기에 진단하는 방법론을 제시하였다. 망막 데이터를 CNN을 기반으로 이진분류 학습 및 다중분류 학습을 수행하였으며, 전처리 된 망막 데이터를 기반으로 치매를 조기 진단할 수 있는 딥러닝 알고리즘을 개발하였다. 딥러닝 모델에 대한 정확도와 재현율을 검증하였으며, 검증 결과 재현율과 정확도 모두 충족하는 결과를 도출하였다. 향후에는 실제 치매 환자의 임상데이터를 기반으로 연구를 지속해 나갈 계획이며, 본 연구의 결과는 치매 문제를 해결하는 방안으로 활용될 수 있다.

KCI후보

5환자의 주관적 증상 텍스트에 대한 진료과목 분류 모델 구축

저자 : 이서희 ( Seohee Lee ) , 강주영 ( Juyoung Kang )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 6권 1호 발행 연도 : 2021 페이지 : pp. 51-62 (12 pages)

다운로드

(기관인증 필요)

초록보기

의료 인공지능 분야에서 의사의 판단에 도움을 줄 수 있는 질환 예측 및 분류 알고리즘에 대해선 많은 연구가 이뤄져왔지만, 의료 소비자의 정보 획득과 판단에 도움을 줄 수 있는 인공지능에 대해선 상대적으로 관심이 적다. 네이버 지식인에 지난 1년 간 자신의 증상엔 어떤 병원을 가야할 지 질문하는 질문 건수만 해도 15만 건이 넘는다는 사실은 의료소비자들에게 적합한 의료정보의 제공이 필요하다는 반증이기도 하다. 따라서 본 연구에선 의료소비자들이 자신의 증상에 대한 진료과목을 선택하는데 도움을 줄 수 있도록 네이버 지식인에서 환자들이 직접 서술한 증상 텍스트를 수집하여 8개 진료과목을 분류하는 분류모델을 구축했다.
우선 환자의 주관이 개입된 데이터의 타당성과 객관성을 확보하기 위해 객관적 증상 텍스트(서울응급의료정보센터에서 정리한 진료과목 별 주요 질환 증상)와 주관적 증상 텍스트(지식인 데이터) 간 유사도 측정을 수행하였다. 유사도 측정 결과, 두 텍스트가 동일한 진료과목의 증상일 경우 상이한 진료과목의 증상 텍스트에 비해 상대적으로 높은 유사성을 가진다는 것을 입증했다. 상기 절차를 따라 타당성을 확보한 주관적 증상 텍스트를 대상으로 릿지회귀모델을 사용하여 분류모델을 구축한 결과 0.73의 정확도를 확보할 수 있었다.

KCI후보

6딥러닝 중심의 자연어 처리 기술 현황 분석

저자 : 박상언 ( Park Sang-un )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 6권 1호 발행 연도 : 2021 페이지 : pp. 63-81 (19 pages)

다운로드

(기관인증 필요)

초록보기

자연어 처리는 최근 기계학습 및 딥러닝 기술의 발전과 적용으로 성능이 빠르게 향상되고 있으며, 이로 인해 활용 분야도 넓어지고 있다. 특히 비정형 텍스트 데이터에 대한 분석 요구가 증가함에 따라 자연어 처리에 대한 관심도 더욱 높아지고 있다. 그러나 자연어 전처리 과정 및 기계학습과 딥러닝 이론의 복잡함과 어려움으로 인해 아직도 자연어 처리 활용의 장벽이 높은 편이다.
본 논문에서는 자연어 처리의 전반적인 이해를 위해 현재 활발히 연구되고 있는 자연어 처리의 주요 분야와 기계학습 및 딥러닝을 중심으로 한 주요 기술의 현황에 대해 살펴봄으로써, 보다 쉽게 자연어 처리에 대해 이해하고 활용할 수 있는 기반을 제공하고자 한다. 이를 위해 인공지능 기술 분류체계의 변화를 통해 자연어 처리의 비중 및 변화 과정을 살펴보았으며, 기계학습과 딥러닝을 기반으로 한 자연어 처리 주요 분야를 언어 모델, 문서 분류, 문서 생성, 문서 요약, 질의응답, 기계번역으로 나누어 정리하고 각 분야에서 가장 뛰어난 성능을 보이는 모형들을 살펴보았다. 그리고, 자연어 처리에서 활용되고 있는 주요 딥러닝 모형들에 대해 정리하고 자연어 처리 분야에서 사용되는 데이터셋과 성능평가를 위한 평가지표에 대해 정리하였다.
본 논문을 통해, 자연어 처리를 자신의 분야에서 다양한 목적으로 활용하고자 하는 연구자들이 자연어 처리의 전반적인 기술 현황에 대해 이해하고, 자연어 처리의 주요 기술 분야와 주로 사용되는 딥러닝 모형 및 데이터셋과 평가지표에 대해 보다 쉽게 파악할 수 있기를 기대한다.

KCI후보

7주부의 연령대별 농식품 소비 특성 비교

저자 : 홍준호 ( Jun-ho Hong ) , 김진실 ( Jin-sil Kim ) , 유연주 ( Yeon-Ju Yu ) , 이경희 ( Kyung-Hee Lee ) , 조완섭 ( Wan-sup Cho )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 6권 1호 발행 연도 : 2021 페이지 : pp. 83-89 (7 pages)

다운로드

(기관인증 필요)

초록보기

라이프스타일이 빠르게 변화하고 있고, 식생활과 식품가공 기술의 발전에 따라 가구별로 식품 소비패턴이 매우 다양하다. 본 논문은 가구 단위의 농식품 구매 정보를 담고 있는 농촌진흥청이 구축하고 있는 소비자 패널 데이터의 식품군을 재분류하고 농식품 소비행위 주체인 패널 대표자의 연령대별로 그룹화하여 농식품 소비 특성 비교를 하였다. 연령대 구분의 기준은 대사질환 유병률로 20% 이상인 60대 이상 그룹과 10% 미만인 30∼40대 그룹으로 나누었다. LightGBM 알고리즘을 사용하여 30∼40대와 60대 이상의 식품 소비패턴의 차이를 분류 분석한 결과 정밀도는 0.85, 재현율은 0.71, F1_score는 0.77로 나타났다. 변수중요도의 결과는 과자류, 엽경채나물류, 조미채류, 과채류, 수산물류 순이었으며, SHAP 지표의 상위 5개 값은 과자류, 수산물류, 조미채류, 과채류, 엽경채나물류 순이었다. 이상치에 민감한 평균을 대신한 중앙값으로 소비패턴을 이진 분류한 결과 과자류의 경우 30∼40대가 60대보다 두 배 이상 높은 것을 알 수 있었다. 이외의 변수에서도 30∼40대와 60대 이상 사이에서 유의미한 차이를 보였다. 연구 결과 30∼40대는 60대보다 과자류를 두 배 이상 소비하는 패턴을 보였으며, 60대의 경우 30∼40대보다 수산물, 조미채류, 과채류, 엽경채나물류를 두 배 이상 섭취하였다. 상위 5개 품목 외에도 밀가공식품인 과자, 빵류, 면류에서 30∼40대의 소비가 높았으며, 이는 60대의 식품 소비패턴과 차이를 보였다.

KCI후보

8아파트 매매가 추이 예측에 관한 연구: 정부 정책, 경제, 수요·공급 속성을 중심으로

저자 : 이중목 ( Jung-mok Lee ) , 최수안 ( Choi-Su An ) , 우수한 ( Su-han Yu ) , 김성훈 ( Seonghun Kim ) , 김태준 ( Tae-jun Kim ) , 우종필 ( Jong-pil Yu )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 6권 1호 발행 연도 : 2021 페이지 : pp. 91-113 (23 pages)

다운로드

(기관인증 필요)

초록보기

한국 자산 시장에서 부동산이 가지는 영향력에도 불구하고 시장 추이 예측은 쉽지 않으며, 그중 아파트는 주거 공간인 동시에 투자 속성을 내포하고 있어 더욱 예측이 쉽지 않다. 아파트 가격에 영향을 주는 요인은 다양하며 지역적 특성 또한 고려되어야 한다. 본 연구는 서울시 전체, 강남 3구, 노원, 도봉, 강북, 금천, 관악, 구로구의 아파트 매매가에 영향을 미치는 요인과 특성을 비교하고 이를 기반으로 가격 예측의 가능성을 파악하기 위해 수행되었다. 분석에는 신경망, CHAID, 선형회귀, 랜덤포레스트 등 머신러닝 알고리즘이 사용되었다. 서울시 전체 아파트 평균 매매가에 가장 중요한 영향을 미치는 요소는 정부 정책 요소였으며, 거래규제 완화, 금융규제 완화 등의 완화 정책이 영향력이 높게 도출되었다. 강남 3구의 경우 정책의 영향력이 낮은 것으로 파악되었으며 강남구의 경우 주택 공급량이 가장 중요한 요인이었다. 반면 6개의 중·하위 구들은 정부 정책이 중요 변수로 작용하였으며 공통적으로 금융규제 정책이 영향을 끼치는 요인이었다.

KCI후보

9스마트서비스를 위한 경량형 IIoT Edge 미들웨어 시스템 개발

저자 : 이한 ( Han Lee ) , 황준석 ( Joon Suk Hwang ) , 강대현 ( Dae Hyun Kang ) , 정석찬 ( Seok Chan Jeong )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 6권 1호 발행 연도 : 2021 페이지 : pp. 115-125 (11 pages)

다운로드

(기관인증 필요)

초록보기

각종 ICT 기술 혁신 및 디지털트랜스포메이션(Digital Transformation)에 의해 사물인터넷(Internet of Things : IoT) 환경이 점차 지능화, 분산화, 자동화된 서비스를 요구하고 있으며, 특히 통신네트워크(5G),데이터 분석 및 인공지능(AI), 디지털 트윈(Digital Twin) 기술이 접목되는 산업사물인터넷(Industrial IoT : IIoT)에서의 고도화되고 안정적인 스마트서비스 제공 환경이 요구되고 있다. 본 연구에서는 다양한 산업현장의 설비 장치와 센서 등 이기종 장치와의 유연한 연계와 신속하고 안정적인 데이터 수집 및 처리 등을 위한 IIoT Edge 미들웨어 시스템을 제안하였다.

KCI후보

10가구당 기기별 에너지 사용량 예측을 위한 딥러닝 모델의 설계 및 구현

저자 : 이주희 ( JuHui Lee ) , 이강윤 ( KangYoon Lee )

발행기관 : (사)한국빅데이터학회 간행물 : 한국빅데이터학회지 6권 1호 발행 연도 : 2021 페이지 : pp. 127-132 (6 pages)

다운로드

(기관인증 필요)

초록보기

우리나라는 자원 빈국인 동시에 에너지 다소비 국가이다. 또한 전기 에너지에 대한 사용량 및 의존도가 매우 높고, 총 에너지 사용의 20% 이상은 건물에서 소비된다. 딥러닝과 머신러닝에 대한 연구가 활발해지면서 다양한 알고리즘을 에너지 효율 분야에 적용하려는 연구가 진행되고 있으며, 에너지의 효율적인 관리를 위한 건물에너지관리시스템(BEMS)의 도입이 늘어가는 추세이다. 본 논문에서는 스마트플러그를 이용하여 직접 수집한 가구당 기기별 에너지 사용량을 바탕으로 데이터베이스를 구축하였다. 또한 RNN과 LSTM 모델을 이용하여 수집한 데이터를 효과적으로 분석 및 예측하는 알고리즘을 구현하였다. 추후 이 데이터는 에너지 사용량 예측을 넘어 전력 소비 패턴 분석 등에 적용할 수 있다. 이는 에너지 효율 개선에 도움이 될 수 있으며, 미래 데이터의 예측을 통해 효과적인 전력 사용량 관리에 도움을 줄 것으로 기대된다.

12
발행기관 최신논문
자료제공: 네이버학술정보
발행기관 최신논문
자료제공: 네이버학술정보

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기