인기검색어 논문

Data Report>인기검색어 논문
2018.08
검색단어: 빅데이터
인기검색어 논문
| | | | 다운로드

KCI등재

1빅데이터 환경에서 개인정보 제공 의도 결정요인에 관한 연구

저자 : 윤승욱 ( Yun Sung-uk )

발행기관 : 한국지역언론학회 간행물 : 언론과학연구 18권 1호 발행 연도 : 2018 페이지 : 52-78(27pages)

다운로드

(기관인증 필요)

초록보기

본 연구는 대학생들을 중심으로 빅데이터 환경에서 프라이버시 위험, 신뢰, 프라이버시 염려와 개인정보 제공 의도의 관계를 살펴보았으며, 주요 결과를 간략하게 제시하면 다음과 같다. 첫째, 빅데이터 환경에서 프라이버시 위험이 프라이버시 염려에 미치는 영향을 살펴본 결과, 프라이버시 위험은 프라이버시 염려에 통계적으로 유의한 정적 영향을 미치는 것으로 나타났다. 둘째, 빅데이터 환경에서 신뢰가 프라이버시 염려에 미치는 영향을 살펴본 결과, 신뢰는 프라이버시 염려에 통계적으로 유의한 부적 영향을 미치는 것으로 나나났다. 셋째, 빅데이터 환경에서 프라이버시 염려가 개인정보 제공 의도에 미치는 영향을 살펴본 결과, 프라이버시 염려는 개인정보 제공 의도에 통계적으로 유의한 부적 영향을 미치는 것으로 나타났다. 넷째, 빅데이터 환경에서 신뢰가 개인정보 제공 의도에 미치는 영향을 살펴본 결과, 신뢰는 개인정보 제공 의도에 통계적으로 유의한 정적 영향을 미치는 것으로 나타났다.


The purpose of this study was to examine the determinant factors of intention to provide personal information in the big data era focused on relationship among privacy risk, trust and privacy concern. The results were as follows. First, privacy risk in the big data era influenced positively on privacy concern. Second, trust in the big data era influenced negatively on privacy concern. Third, privacy concern in the big data era influenced negatively on intention to provide personal information. Fourth, trust in the big data era influenced positively on intention to provide personal information.

KCI등재

2빅데이터퀘스천 - 빅데이터 활용에 대한 인문학적 비판과 질문 -

저자 : 유강하 ( Yu Kang-ha )

발행기관 : 영남대학교 인문과학연구소 간행물 : 인문연구 82권 0호 발행 연도 : 2018 페이지 : 187-214(28pages)

다운로드

(기관인증 필요)

초록보기

빅데이터, 사물인터넷(IoT), 인공지능은 현대 사회의 중요한 화두이다. 이 가운데서도 빅데이터는 지금까지 공공의 영역과 기업의 이윤 추구에 생산적인 결과를 도출해 왔다. 현재까지의 데이터를 바탕으로 미래를 예측할 수 있다는 빅데이터에 대한 전망은 빅데이터의 적극적 활용으로 이어지게 되었다. 그러나 빅데이터 사용에도 우려할 만한 지점이 존재한다. 빅데이터는 인간과 삶, 사회에 유용하게 활용될 것이라는 믿음에서 만들어졌지만, 지금까지 빅데이터는 주로 기업의 이윤 창출과 효용성의 극대화에 적극적으로 활용되었고, 이러한 과정 속에서 '인간'이라는 기본적인 철학이 붕괴되고 있는 듯이 보인다. 빅데이터 활용이 가속화되는 이 시점에, 인문학은 도덕적, 윤리적 감수성을 제공한다는 점에서 진지하게 다루어질 필요가 있다. 특히 다음과 같은 세 영역에서 인문학적 성찰과 질문이 필요해 보인다. (1) 개인정보 유출과 프라이버시의 침해 문제, (2) 오독과 조작의 문제, (3) 인간의 생명과 존엄성에 관한 문제가 그것이다. 빅데이터가 야기하는 문제는 인간, 삶, 개별성, 존엄성이라는 근원적인 문제라는 점에서 소홀히 다룰 수 없다. 현재 우리 사회에는 빅데이터가 인류를 더 나은 미래로 이끌어 줄 것이라는 전망이 우세하지만, 빅데이터를 통해 분명히 알 수 있는 것은 과거와 현재일 뿐, 그것이 곧 미래에 대한 정확한 예측을 의미하지는 않는다. 빅데이터가 분명한 방향성을 제시할 수는 있지만, 그것이 인류의 건강한 미래로 직결된다고 단언하기는 어렵다. 빅데이터가 인간과 삶, 인류의 미래를 위해 사용되는 것이라면, 다수(big)의 흐름에 앞서 '인간 삶'이라는 기본 전제 위에서 의심하고 비판하며, 건강한 방향성을 설정하려는 인문학적 비판이 필요하다. 빅데이터가 창출한 가치에 대한 환호에 앞서, 그것이 과연 무엇을 위해 존재하는지에 대해 인문학이 던지는 근원적이고 큰 질문, 즉 빅퀘스천이 필요하다.


Big data, Internet of Things, and Artificial Intelligence are important topics in modern society. So far, big data has produced useful results in modern society. The prospect that big data can predict the future leads to active utilization of big data. However, there are problems in using big data. Big data has been actively utilized mainly in profit-making or profit maximization. In this process, the basic philosophy for 'human being' is collapsing. Humanities are important because they provide moral sensitivity. It seems that humanities reflection and questions are needed to solve the following three problems. (1) personal information leakage and privacy invasion (2) misreading and rigging of data (3) human life and dignity. Problems arising from the use of big data should be treated seriously in terms of issues of human, life, human individuality, and dignity. People believe that big data will lead humans to the perfect future, but big data only tells the past and present. Although big data can present the direction of the future, but it is not synonymous with human - being's bright future. If big data is used for human- being, life and future, humanistic questions should be asked. Before expecting the value created by big data, we have to ask humanistic questions about why big data exists.

다운로드

(기관인증 필요)

초록보기

빅데이터 시대의 소비자는 소셜 네트워크를 통해 정보 탐색과 의견 개진에 적극적이며 빠른 의사 결정을 통해 기업의 모든 활동을 평가한다. 이러한 소비자들에게 효과적으로 정보를 전달해줄 새로운 커뮤니케이션 콘텐츠가 필요하다. 본 연구는 선행연구를 바탕으로 인터넷과 소셜 미디어에서 공유되고 있는 카드뉴스의 유형화와 마케팅 활용 사례를 분석하였다. 연구 결과 이미지를 활용하고 각종 정보에 스토리텔링을 적용하여 자연스럽게 정보에 대한 신뢰를 높이고 받아들이는 유형이 많았다. 또한 제품이나 서비스 또는 콘텐츠 제공자를 직접 노출하는 광고형과 콘텐츠 사이에 광고 내용을 자연스럽게 노출시키는 홍보형의 활용이 많았다. 본 연구결과를 통해 카드뉴스 콘텐츠의 유용성과 활용 방안에 대한 필요성을 강조하고 기업의 마케팅 커뮤니케이션 활동에 이론과 실무적 시사점을 제공할 것으로 기대한다.


In this big data era, consumers evaluate whole corporate activities through active and quick decision-making in the course of information search and opinion suggestion via social networks. So, new communication contents are needed to convey information effectively to these consumers. This study, building on previous research, analyzed types of card news shared at internet and social media as well as cases of use for marketing. As a result, the study found there were plenty of types that enhanced reliability on the given content smoothly by using images and applying storytelling to diverse information. Along the way, there was much use of advertisement types directly exposing products, services or content providers as well as PR types exposing advertisement content in between the contents. This study expects that through these findings, usability of card news contents and need for measures to use are emphasized, and further provides theoretical and practical implications for corporate marketing communication activity.

KCI등재

44차 산업혁명시대의 빅데이터 정보자원 관리전략에 관한 연구

저자 : 고형석 ( Hyeong-seog Kho ) , 이홍제 ( Hong-je Lee ) , 임화연 ( Hwa-yeon Lim ) , 한경석 ( Kye

발행기관 : 한국EA학회(구 한국ITA학회) 간행물 : 정보화연구(구 정보기술아키텍처연구) 15권 2호 발행 연도 : 2018 페이지 : 119-131(13pages)

다운로드

(기관인증 필요)

초록보기

미래의 4차산업혁명시대에서 가장 중요한 정보자원으로 관리해야 하는 대상으로 데이터는 빠지지 않을 것이다. 빅데이터는 데이터 가치를 파악하고, 데이터를 활용하게 하는 확실한 방안이지만, 빅데이터를 준비하는 단계부터 빅데이터를 관리하기 위한 전략이 필요하다. 왜냐하면, 빅데이터는 많은 정보자원을 도입해야 사용이 가능하기 때문에 체계적으로 정보자원을 관리해야한다. 정보자원을 효율적으로 관리해서 조직목표 달성에 기여하는 것이 정보자원 관리의 목적이다. 다양하고 복잡한 빅데이터 정보자원 관리를 위한 도구로 범정부 EA활용에서 착안하였다. 빅데이터 사례를 EA관점에서 분석하면서 정보자원 관리기준과 체계로서 EA를 검증하였다. EA는 정보자원 관리도구로 충분하다는 연구결과를 도출하였다. 빅데이터 등 새로운 정보자원 관리의 전략으로서 EA를 제안한다.


Data is the most important information resource in the future industrial revolution era. Big Data is a clear way to understand data values and leverage data, but strategies are needed to manage Big Data from the start of preparing Big Data. Because Big Data requires a lot of information resources to be introduced so that it needs to be systematically managed. The strategy of information resource management is to manage information resources efficiently and to contribute to achieving organizational goals. It was inspired by the use of government-governed EA as a tool for managing diverse and complex Big Data information resources. In analyzing the Big Data case from an EA perspective, EA was validated as an information resource management criteria and framework. EA has derived research results that are sufficient with information resource management tools. It proposes EA as a strategy for managing new information resources such as Big Data.

KCI등재

5전자무역 분야 빅데이터 활용 사례연구

저자 : 이호형 ( Ho-hyung Lee )

발행기관 : 한국EA학회(구 한국ITA학회) 간행물 : 정보화연구(구 정보기술아키텍처연구) 15권 2호 발행 연도 : 2018 페이지 : 179-186(8pages)

다운로드

(기관인증 필요)

초록보기

무역업계가 가장 주목하는 4차 산업혁명 기술이 빅데이터이지만 전자무역 분야에서 빅데이터관련 연구는 거의 이루어지지 않았다. 본 연구에서는 전자무역 분야에서 빅데이터가 활용되고 있는 사례들을 조사하여 향후 연구의 방향성을 제시하였다. 무역 빅데이터는 자료 접근 문제 때문에 우리나라에서는 관세청, 은행, 한국무역협회 등 기관 중심의 활용 사례를 발굴할 수 있었다. 기업 차원에서 무역 빅데이터 활용사례는 DHL과 Import Genius에서 찾을 수 있었다. 사례들을 요약하면 빅데이터를 통한 무역통계의 고도화, 무역금융 사기의 예방, 그동안 접근하기 힘들었던 바이어·유통업체·거래량 등 정보를 파악하는 데 빅데이터를 활용하는 것으로 압축할 수 있다. 이를 통한 향후 연구제안은 다음과 같다. 첫째, 전자무역 분야 빅데이터 활용 서비스의 고도화와 활용성과 확대를 위한 연구가 필요하다. 둘째, 전자무역 서비스 강화를 위해 빅데이터 접근 범위를 확대하고 데이터의 가치를 높일 수 있는 비즈니스 모델 설계 연구가 활성화 될 필요가 있다.


Big data is the most important technology in the trade industry, but little research has been done on big data in the field of e-Trade. This study investigates the cases where big data are used in the field of e-Trade and suggests the direction of future research. Due to the data access problem, trade big data has been able to find institutional use cases such as Korea Customs Service, Bank, Korea International Trade Association. At the enterprise level, trade big data use cases were found in companies such as DHL and Import Genius. The cases can be summarized as the enhancement of trade statistics through big data, the prevention of trade finance fraud, and the information such as buyers, distributors, and volume of transactions that were difficult to approach. The future research suggestions are as follows. First, research is needed to enhance the utilization and utilization of big data utilization services in the e-Trade field. Second, business model design research that can expand the scope of big data and enhance the value of data needs to be activated in order to strengthen e-Trade services.

KCI등재

6초연결사회의 도래와 빅데이터 -법제도적 개선방안을 중심으로-

저자 : 장완규 ( Jang Wan-kyu )

발행기관 : 한남대학교 과학기술법연구원 간행물 : 과학기술법연구 24권 2호 발행 연도 : 2018 페이지 : 113-159(47pages)

다운로드

(기관인증 필요)

초록보기

빅데이터 산업은 미래의 국가경쟁력을 좌지우지할 중요한 산업분야로서 제4차 산업혁명의 핵심분야다. 특히 IT기술의 발달과 함께 인터넷의 빠른 보급으로 인하여 스마트폰, 태블릿 컴퓨터, 웨어러블 기기 등의 모바일기기를 비롯하여 사물인터넷 및 각종 센서 등을 통한 네트워크 접속이 빈번하게 이루어짐으로써 현재 우리는 초연결사회를 살아가고 있다. 초연결사회와 빅데이터 환경은 과거에 비해 데이터의 양이 폭증했다는 점과 함께 데이터의 종류도 다양해져 사람들의 행동은 물론 위치정보와 SNS를 통해 사람들의 생각과 의견까지 분석하고 예측할 수 있게 되었다. 즉 디지털 경제의 확산으로 우리 주변에는 규모를 가늠할 수 없을 정도로 많은 정보와 데이터가 생산되는 '빅데이터(Big Data)' 환경이 도래하고 있다. 제4차 산업혁명의 시대와 함께 빅데이터는 21세기의 원유라 비유될 정도로 모든 산업의 근간이자 소스(IoT, Cloud Computing, 인공지능, 무인자율주행차 등)가 되고 있다. 초연결사회를 살아가는 현 시점에서 우리에게 개인정보의 이용 및 활용에 대한 인식의 전환이 필요하다. 즉 너무 경직된 개인정보 보호의 체계에서 벗어나 좀 더 유연한 자세를 가지고 개인정보나 데이터를 바로 보아야 할 때라고 생각한다. 더불어 우리가 법제도적으로 검토해 보아야 할 문제점들도 여기저기 발생하고 있다. 다양한 경로를 통하여 수집, 저장, 가공된 데이터로 인하여 개인정보가 침해되는 일이 발생하는 경우, 빅데이터 분석기법에 활용된 알고리즘의 오류 또는 편향성으로 인하여 전혀 다른 왜곡된 결과가 도출됨으로써 이로 피해를 입는 경우, 그리고 빅데이터 분석을 통해 얻은 결과물에 대한 영업비밀로서의 가치 또는 저작권으로서의 보호 가능성 등 지적재산권의 보호 및 침해 등의 다양한 문제점들이 발생한다. 따라서 본 논문에서는 '빅데이터'란 무엇인지, 그리고 지금 현재 어떻게 활용되고 있으며, 구체적으로 어떠한 문제점들이 있는지 하나하나 짚어보고 이를 개선하기 위한 방안으로 개인정보보호의 관점, 알고리즘 규제 관점, 그리고 지적재산권적 관점에서 빅데이터를 살펴보고자 한다. 더불어 제4차 산업혁명을 다루는 기술 분야에 대한 입법은 경직된 법체계보다는 자율규제 또는 자기통제의 방식으로 추진해 나가는 방식이 타당하다고 생각한다. 현행법으로는 급속도로 발전하는 기술의 속도를 따라잡을 수 없으며 그 법은 기술의 혁신을 가로막는 규제로 남게 될것이기 때문이다. 일단 자율규제의 방식에 따라 운용해 나가면서 법의 미비나 강력한 규제가 필요한 부분에 대해서는 사후적으로 입법을 하는 방식으로 규율해 나가는 것이 현명하다. 필자가 제시하는 입법방식으로는 네거티브 규제나 규제 샌드박스의 형태가 유용하다는 점을 밝혀둔다.


The Big Data Industry is an important industrial field that will control the future national competitiveness and is the core of the Fourth Industrial Revolution. Especially, with the development of IT technology and rapid diffusion of the Internet, network connection is frequently made through mobile devices such as smart phones, tablet computers, wearable devices, object internet, and various sensors. As a result, we are now living in a super-connected society. The Advent of Hyper-Connected Society and big data environments have seen a surge in data volume compared to the past. And the kinds of data have been diversified so that people's behaviors as well as location information and SNS can analyze and predict people's thoughts and opinions. In other words, the 'Big Data' environment is in the process of producing large amounts of information and data that can not be measured due to the spread of the digital economy. With the era of the Fourth Industrial Revolution, Big Data has become the basis of all industries and sources(IoT, Cloud Computing, Artificial Intelligence, Self-driving Car, etc.). At this point, we need to change our perception of the use and use of personal information. In other words, I think it is time to look at personal information and data with a more flexible attitude away from the rigid system of personal information protection. In addition, there are many problems that we have to examine legally. Specifically, big data and privacy, big data and algorithm bias, big data and intellectual property rights. Therefore, in this paper, I examine what Big Data is and how it is currently being used and what are the specific problems. In order to improve this, I want to examine big data in terms of privacy protection viewpoint, algorithm regulation viewpoint, and intellectual property point of view. In addition, I think that the legislation on the technology field dealing with the Fourth Industrial Revolution is appropriate in the way of self-regulation or self-control rather than rigid legal system. Current law can not catch up with the pace of rapidly evolving technology, and it will remain a barrier to technological innovation. It is prudent to rule in the way of legislation after the fact that it operates once according to the method of self-regulation and the part where the law is weak or strong regulation is necessary. It should be noted that the form of the negative regulation or regulatory sandbox is useful for the legislation that I present.

KCI등재

7지방정부의 빅데이터 활용에 관한 영향요인 분석: 서울시 공무원의 인식을 중심으로

저자 : 강정묵 ( Jungmuk Kang )

발행기관 : 성균관대학교 국정관리대학원 간행물 : 국정관리연구 12권 1호 발행 연도 : 2017 페이지 : 161-198(38pages)

다운로드

(기관인증 필요)

초록보기

본 연구는 빅데이터 활용에 기본적인 환경을 제시해보고 빅데이터 활용에 영향을 미치는 요인을 실증적으로 분석하였다. 빅데이터 활용의 영향요인을 분석한 결과, 법제도 요인, 기술 요인, 데이터 요인이 매개변수인 행태 요인에 영향을 주었으며, 법제도 요인을 제외한 모든 요인이 빅데이터 활용에 영향을 미치는 것으로 나타났다. 본 연구의 시사점을 살펴보면, 빅데이터 활용수준을 높이기 위해서는 빅데이터에 관한 기본적인 이해를 높이고 전문성을 갖춘 인력을 지속적으로 양성할 수 있는 교육체계를 마련해야 한다. 또한 빅데이터 기술을 기반으로 공공데이터를 보다 정확하고 객관적으로 운영할 수 있는 데이터 관리체계를 구축할 필요가 있다. 본 연구에서는 빅데이터를 활용하기 위한 기본적인 환경을 구성해보고 빅데이터 활용에 영향을 미치는 요인을 도출해보았다는 점에서 연구의 의미를 두고자 한다.


This study was to present the basic environment for Big Data and empirically analyze the factors that affect big data utilization. Factors influencing big data utilization were analyzed and as a result, legal system factors, technology factors and data factors influenced behavioral factors, which are parameters, and all the factors except the legal system factors were found to influence the utilization of big data. Based on the implications of this study, it is necessary to establish an educational system that can raise a basic understanding of big data and continuously train professional manpower in order to increase the big data utilization level. It is also necessary to build a data management system that can operate public data more accurately and objectively based on Big Data Technology. The significance of this study is that we created a basic environment for utilizing Big Data and derived the factors that affect Big Data.

8환경 빅데이터 분석 및 서비스 개발

저자 : 강성원 ( Sung Won Kang ) , 이동현 , 장기복 , 진대용 , 홍한움 , 한국진 , 김진형 , 강선아 , 김도연 , 정은혜

발행기관 : 한국환경정책평가연구원 간행물 : 사업보고서 2017권 0호 발행 연도 : 2017 페이지 : 1-465(465pages)

다운로드

(기관인증 필요)

초록보기

본 연구는 단기예측 및 패턴 파악에 비교우위가 있는 빅데이터 연구 방법론의 환경정책연구에 대한 적용 가능성을 모색하였다. 본 연구는 환경연구 전 부문에 빅데이터 연구 방법론을 적용하는 '환경 빅데이터 연구', 환경 관련 자료를 수집, 축적하는 '환경 빅데이터 플랫폼 구축 연구', 연구성과를 이용하여 환경 서비스를 개발하는 '원내외 빅데이터 서비스 개발'의 3개 영역에 걸쳐서 3년간 3단계의 연구를 진행한다. 2017년에는 본 연구를 구성하는 3단계 연구 중 '환경 빅데이터 연구'에 중점을 두는 제1단계 연구를 시작하였다. 2017년에는 상대적으로 전처리 부담이 적은 수치 및 전산화된 텍스트 분석에 집중하여, 빅데이터 연구 방법론의 환경정책연구 가능성을 진단하였다. 그 결과 환경오염 추정 알고리듬 3개, 텍스트 자료 이용 환경연구 동향 파악 알고리듬 3개, 온라인 환경 관련 자료의 집적을 자동화하는 자료 수집 알고리듬 3개를 구축하였다. 본 연구에서 개발한 환경오염 추정 3개 알고리듬은 ① 서울지역 측정소 단위 시간별 미세먼지 오염도를 예측하는 KNN 공간순환신경망 알고리듬, ② 기초지자체의 월별 장감염 발생 건수를 추정하는 심층신경망 알고리듬 ③ 기초지자체 월별 미세먼지 오염도 발생요인을 파악하는 의사결정나무 기반 알고리듬이다. 서울지역 측정소 단위 시간별 미세먼지 농도 예측 KNN 공간순환신경망 알고리듬은 서울지역 39개 측정소의 2016년 1년간 미세먼지(PM10) 오염도 자료를 이용하여 구축하였으며, 미세먼지 농도를 2시간 전에 예측할 수 있도록 하였다. 설명변수로는 4개 대기오염물질오염도(SO2, CO, O3, NO2) 및 기상 정보(기온, 강수량, 풍속, 풍향)를 사용하였다. 분석결과 본 연구에서 개발한 KNN공간순환신경망 알고리듬은 통상적으로 시계열 예측에 사용하는 ARIMA 모델보다 예측치와 실측치 간 평균제곱근오차를 10.5% 축소하는 정확한 추정치를 제공할 수 있음을 확인하였다. 기초지자체의 월별 장감염 발생 건수를 추정하는 심층신경망 알고리듬은 건강보험 코호트 DB를 이용하여 구축한 2009~2013년 월별 장감염 발생빈도를 기상자료, 대기오염 자료, 인구 통계적 자료, 위-경도 좌표를 이용하여 추정하는 심층신경망 알고리듬이다. 이 알고리듬은 노드가 500개인 3개의 은닉층을 지니며, 활성화 함수로는 ReLU 함수를 사용하였고, Epoch 30회에 걸쳐서 학습을 진행하여 도출한 모수 값을 이용하여 구축하였다. 이렇게 구축한 심층신경망 모델은 같은 변수를 사용한 선형회귀분석 모델보다 평균제곱근오차가 25% 낮은 정확한 추정치를 도출할 수 있었다. 기초지자체 월별 미세먼지 농도 추정 의사결정나무 기반 알고리듬은 2001년 1월~2016년 9월 시군구 월평균 미세먼지(PM10) 농도 자료의 추정을 목적으로 구축하였다. 독립변수로는 대기오염물질 오염도, 대기오염물질 배출량, 기상변수, 황사일수, 중국 베이징, 상하이, 톈진의 대기오염 자료를 이용하였다. 자료의 가용성에 따라서 추정 시기와 독립변수의 집합을 달리하는 6개의 실험을 실시하였으며, 매 실험에 의사결정나무, 랜덤포레스트, 배깅, 부스팅 4개의 방법론을 적용하였다. 분석 결과 랜덤포레스트 및 부스팅 알고리듬은 선형회귀분석의 평균제곱오차를 각각 45.5%, 37.2% 개선하는 효과가 있었다. 그리고 독립변수에 황사일수, 베이징/상하이의 미세먼지 오염도, 베이징/톈진의 대기질 지수가 포함될 경우 추정치의 평균제곱오차가 크게 줄어든다는 사실을 확인하였다. 이는 국내 미세먼지오염도가 중국의 대기오염에 크게 영향을 받는다는 기존의 주장을 뒷받침하는 결과이다. 본 연구에 개발한 텍스트 자료 분석 알고리듬은 모두 3개로 환경정보 문헌을 분석하여 문헌 토픽을 추출하는 LDA 분석 알고리듬, 문헌의 키워드 간 연관규칙을 발견하는 연관성 분석 및 키워드 네트워크 분석 알고리듬, 키워드 간 문장 내 관계를 분석하는 Word2Vec 알고리듬이다. 본 연구에서는 이상의 3개 알고리듬을 1993~2016년 KEI 연구보고서 및 2001~2016년 네이버 환경뉴스에 적용하여 두 종류의 문헌의 특성을 비교하였다. LDA 분석 결과는 다음과 같다. 2008~2012년간 KEI 연구 중 기후변화의 비중이 네이버 뉴스에서 기후변화 비중보다 상대적으로 높았으며, 폐기물, 에너지-자원, 수질오염 연구의 비중은 네이버 뉴스의 비중보다 낮았다. 그리고 2013년 이후에도 에너지-자원 및 폐기물 연구의 비중이 네이버 뉴스의 비중보다 낮은 수준으로 유지되고 있었다. 그리고 2013년 이후 네이버 뉴스에서 그 비중이 급증하고 있는 '유전자 변형-소음', '보건-데이터' 관련 연구가 KEI 연구동향에서는 독립된 토픽으로 나타나지 않아서, 이에 대한 연구가 필요한 것으로 파악되었다. 연관성 분석 및 키워드 네트워크 분석 결과는 다음과 같다. 키워드 네트워크의 시기적 추이를 보면 KEI는 2003~2007년간 기후변화 연구를 선도하였으며, 기후변화 및 녹색성장에 대한 민간의 관심이 높았던 2008~2012년에는 해당 연구를 중심으로 연구를 수행하였다. 단, 2013년 이후에는 네이버 뉴스에서 기후변화 연관 키워드가 세부주제를 중심으로 분기하고 있는 것과 달리, KEI 연구보고서에서는 기후변화 키워드의 중심성이 강화되고 있어 최근 조류를 반영하는 연구가 필요한 것으로 파악되었다. Word2Vec 분석 결과는 다음과 같다. Word2Vec 분석에서는 기후변화의 세부현상인 온난화, 홍수, 가뭄 3개 단어와 문장 내 연관관계가 높은 단어들을 파악하여 매체 간 비교를 수행하였다. KEI 보고서는 온난화의 단기적인 영향, 온난화가 인간에 미치는 영향, 홍수의 국내 영향, 가뭄이 인간에 미치는 영향과 관계된 단어가 3개 단어와 연관성이 높은 것으로 파악되었고, 네이버 뉴스에서는 온난화의 초장기적인 영향, 온난화가 생물 및 식량에 미치는 영향, 해외 홍수의 피해, 가뭄이 농업에 미치는 영향과 관계된 단어의 연관성이 높은 것으로 파악되었다. 이러한 차이는 연구보고서가 국민의 삶에 질과 연관하여 기후변화를 연구하고 있는 데 비해, 네이버 뉴스는 기후변화로 인한 세계적인 피해를 중심으로 기사가 작성되고 있는 현상을 반영한다고 할 수 있다. 이상에서 소개한 3개의 알고리듬을 2개의 텍스트 문헌에 적용한 텍스트 분석 결과로부터 환경 연구 수요 및 현재 연구 부족 분야를 파악하였다. 토픽 구성 변화를 보면, '에너지-자원', '폐기물', '유전자 변형/소음', '보건/데이터'에 대한 민간의 관심이 제고되고 있는데 연구동향은 이를 담아내지 못하고 있었다. 그리고 키워드 분석의 결과를 보면 민간의 관심은 태풍, 한파, 대설 등 세분화된 기후변화 주제로 이동하고 있지만 연구동향은 기후변화 일반을 중심으로 전개되고 있었다. 따라서 환경연구의 외연을 기후변화 외부 영역으로 확장하고, 기후변화와 관계된 연구는 연구주제를 세분화하는 연구가 필요하다고 할 수 있다. 환경 빅데이터 연구 인프라 구축의 일환으로 공공데이터포털(대기오염 및 기상정보), 한국환경공단 AirKorea, 기상자료개방포털 3개 웹페이지의 자료 수집 알고리듬을 개발하였다. 공공데이터포털 자료 수집 알고리듬은 공공데이터포털에서 제공하는 API 서비스를 이용하여 자료를 수집하는 알고리듬이다. 한국환경공단 AirKorea 자료 수집 알고리듬은 웹사이트에 직접 접속하여 자료를 수집하는 알고리듬이다. 이상 2개의 알고리듬은 데이터를 수집하고 추출하는 전 과정을 Python 코드로 작성하여 자동화하였다. 반면 기상자료개방포털 자료 수집 알고리듬은 셀레니움(Selenium) 프로그램을 이용하여 웹브라우저의 로그인 과정을 대행하고, 로그인 이후부터 압축파일(Zip)로 제공되는 자료를 다운로드하는 과정을 자동화한 알고리듬이다. 이 3개 알고리듬을 구축하여 자료가 직접 게시되는 경우, API를 통해 제공되는 경우, 압축파일 형태로만 제공되는 경우에 각각 대응 가능한 자료 추출 도구를 구비하였다. 2017년 본 연구는 빅데이터 연구 방법론을 수치 자료에 적용하면 기존의 방법론보다 소규모 지역 단위에서 예측오차를 단축할 수 있고, 텍스트 자료에 적용하면 민간의 연구에 대한 수요(환경뉴스) 및 연구 공급 현황(연구보고서)을 비교·분석할 수 있음을 확인하였다. 본 연구가 제공하는 정교한 환경정보 예측치는 그 자체로서 민간 환경정보 서비스의 인프라로 기능할 수 있고, 단기 소규모 지역 단위 정책재원 운용의 기준으로 활용할 수 있다. 또한 의사결정나무를 이용하여 독립변수의 중요도를 파악하는 기법을 적용하면, 재정지출이 환경오염에 미치는 영향의 중요도를 평가하여 소규모 지역 단위 재정운용 성과평가 수단으로도 활용할 수 있다. 본 연구의 성과는 빅데이터 연구 방법론이 민간 환경정보사업의 인프라 구축, 정책운용의 효율성 제고, 정책평가 수단의 확충이라는 3가지 측면에서 잠재적으로 정책적 활용 가능성이 있음을 보여 주었다. 본 연구의 성과는 본 연구에서 구축한 깃허브(https://github.com/keibigdata)에 공개하였으며, 향후 본 연구에서 개발하는 환경 빅데이터 분석플랫폼의 기초자료로 활용할 계획이다.


The key advantages of Machine Learning analysis using large data are 1) accurate forecast and 2) unknown-pattern finding In this report, we try to make use of these advantages in Environmental Research and Service. This research is composed of three components. First, we apply Machine learning algorithm to environmental research. (2017~19) Second, we accumulate data and algorithms developed in environmental research and combine them with environmental data web crawling algorithm to build environmental machine learning platform(2020~22). Third, we develop public environmental service using these research results and platform(2023~25). In 2017, we developed three machine learning algorithms applied to environment data - LSTM algorithm estimating hourly find dust pollution, Random Forest/Boosting ensemble algorithm estimating monthly find dust pollution, DNN algorithm estimating intestinal infection case numbers using climate data. Also we applied LDA/Association Rule Learning/word2vec algorithm to online news data and KEI report data, and found that KEI should pay more attention to generic mutation, noise, environmental health, environmental data and specific climate issues like typhoon, severe cold, heavy snow to catch up with public interests represented in online news data.

9환경 분야 빅데이터 수집방법 연구 : 대기질 데이터를 중심으로

저자 : 한국진 ( Kj Han ) , 강성원 , 김도연 , 김영인

발행기관 : 한국환경정책평가연구원 간행물 : 기초연구보고서 권호. 발행 연도 : 2017 페이지 : 1-57(57pages)

다운로드

(기관인증 필요)

초록보기

본 연구는 지능정보사회의 근간인 빅데이터에 대한 이해를 통해 환경 연구에 활용 가능한 빅데이터를 식별하고 데이터 기반 연구혁신을 위한 수집 방법으로서 환경 빅데이터 수집-저장의 절차와 프레임워크(안)를 제시하였다. 미래 사회와 연구 패러다임의 중심에 선 빅데이터를 환경 연구에 활용하기 위해서는 빅데이터에 대한 충분한 이해와 적극적인 활용이 필요하다. 더불어 환경 분야 빅데이터에 대한 식별 및 대응(안)도 마련되어야 한다. 이에 대한 사례로서 한국환경공단의 대기질 빅데이터 및 그 서비스를 분석하였고 분석과정을 통해 빅데이터 수집-저장방법의 절차를 검토하고 수집방법에 대한 프레임워크(안)를 제시하였다. 본 연구의 주요 내용은 다음의 3가지로 요약할 수 있다. ○ 빅데이터의 이해 빅데이터는 데이터의 수집-저장-분석-(시각화)-예측의 절차를 갖고 있지만 사회 전반적으로 다양한 이해와 의미를 갖고 있어 환경 분야 빅데이터 또한 다른 접근방법 및 이해가 필요하다. 그동안 빅데이터가 정부 주도형으로 추진되어 양적 성장을 이뤄냈고 우리나라에서는 공공데이터포털을 통해 데이터가 없더라도 데이터 제공자를 찾을 수 있는 제도적 장치가 마련되어 있다. 그러나 데이터 처리를 위한 첫 번째 단계인 수집-저장 단계에서는 성장보다 접근성, 활용성이 요구되며 연구자의 애로사항이나 수요를 고려한 데이터를 활용할 수 있는 수요자 관점에서 수집방법을 검토하였다. ○ 환경 분야 빅데이터 환경 분야의 빅데이터라 함은 모든 분야의 데이터를 일컫는다고 해도 과언이 아니다. 따라서 수요자 중심의 데이터 우선순위를 부여하고 그 사례를 제시하였다. 공공데이터포털 활용 신청 순위의 검토 및 한국환경정책·평가연구원 연구자 대상의 데이터 활용 온라인 설문을 통해 기상기후 및 대기질 데이터가 도출되었다. 이 가운데 활용성이 우수하고 동일한 규모의 데이터셋을 제공하고 있는 한국환경공단의 대기질 데이터 및 데이터 서비스를 분석하였다. ○ 수집방법의 절차화 위와 같은 분석을 통해 연구자들에게 특정 빅데이터에 대한 수집방법만을 제시한다면 기존의 방법과 다르지 않다고 판단하였다. 이에 도출된 수집방법을 통해 수집-저장방법의 절차를 마련하고 이를 프레임워크(안)으로 제시하고자 하였다. 이를 활용하면 다른 환경 빅데이터를 활용하는 연구에도 적용할 수 있고 컴퓨팅 플랫폼에도 적용이 수월하다. 또한 빅데이터 수집-저장 프레임워크(안)를 통해 활용 가능한 구체적인 소프트웨어 등의 컴퓨팅환경을 언급하여 데이터 기반 연구수행 체계로의 전환 또는 접근이 용이하도록 안을 제시하였다.


The purpose of this study is identify the big data that can be used for environmental research through understanding the big data which is the basis of intelligent information society and to develop a procedure and framework of environment big data. In order to using the big data as a center of future and research paradigm, it is necessary to understand and actively apply the big data. In addition, identification and countermeasures for environmental data should be prepared. As a case study, it analyzed the air quality data and services of Airkorea, the process of scraping and storing the big data through service analytic process and presented a framework for scraping method.

KCI등재

10빅데이터 기반 비대면 본인확인 기술에 대한 연구

저자 : 정관수 ( Jung Kwansoo ) , 염희균 ( Yeom Hee Gyun ) , 최대선 ( Choi Daeseon )

발행기관 : 한국정보처리학회 간행물 : 정보처리학회논문지. 컴퓨터 및 통신시스템 6권 10호 발행 연도 : 2017 페이지 : 421-428(8pages)

다운로드

(기관인증 필요)

초록보기

최근 온라인 금융서비스의 성장과 금융 기술의 급격한 발전으로 인하여 온라인에서 사용자를 등록 및 인증하기 위한 비대면 본인확인 기술에 대한 다양한 접근 방법의 필요성이 제기되고 있다. 일반적으로 비대면 방식은 대면방식에 비해서 많은 위협에 노출되어 있다. 따라서 최근에는 이런 위험성을 보완하고 보다 신뢰할 수 있는 비대면 본인확인 방법을 위해서 다양한 요소와 채널을 이용하여 사용자를 검증할 수 있는 정책과 기술이 연구되고 있다. 이러한 새로운 접근방법 중 하나는 다수의 사용자 개인정보를 수집하고 검증하는 기술이다. 따라서 본 논문은 사용자의 다양하고 많은 정보를 기반으로 온라인에서 본인확인을 수행하는 빅데이터 기반 비대면 본인확인 방법을 제안한다. 또한 제안방법은 서비스에서 요구하는 본인확인 등급에 필요한 사용자 정보만 수집하고 검증하는 세분화된 본인확인 정보관리 방법을 제안한다. 그리고 본 논문은 검증된 본인확인 정보를 사용자가 재사용할 수 있도록 다른 서비스 제공자들과 공유할 수 있는 본인확인 정보공유 모델을 제안한다. 마지막으로 제안 방법이 비대면 본인확인 과정에서 강화된 사용자 검증을 통해서 서비스에서 요구하는 본인확인 등급만 검증하고 관리하는 시스템을 구현하여 실험 결과를 분석한다.


The need for various approaches to non-face-to-face identification technology for registering and authenticating users online is being required because of the growth of online financial services and the rapid development of financial technology. In general, non-face-to-face approaches can be exposed to a greater number of threats than face-to-face approaches. Therefore, identification policies and technologies to verify users by using various factors and channels are being studied in order to complement the risks and to be more reliable non-face-to-face identification methods. One of these new approaches is to collect and verify a large number of personal information of user. Therefore, we propose a big-data based non-face-to-face Identity Proofing method that verifies identity on online based on various and large amount of information of user. The proposed method also provides an identification information management scheme that collects and verifies only the user information required for the identity verification level required by the service. In addition, we propose an identity information sharing model that can provide the information to other service providers so that user can reuse verified identity information. Finally, we prove by implementing a system that verifies and manages only the identity assurance level required by the service through the enhanced user verification in the non-face-to-face identity proofing process.

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기