SCFI 지수 예측 모형의 성능 향상을 위한 텍스트 데이터 기반 문자열 가중치 추출 연구

김민섭; 허재현; 김도희; 배혜림

(사)한국빅데이터학회 한국빅데이터학회지 SCFI 지수 예측 모형의 성능 향상을 위한 텍스트 데이터 기반 문자열 가중치 추출 연구

KCI 등재

SCFI 지수 예측 모형의 성능 향상을 위한 텍스트 데이터 기반 문자열 가중치 추출 연구

A Study on Text-Based Weight Extraction for Enhanced SCFI Index Prediction

김민섭 ( Min-seop Kim ) , 허재현 ( Jae-hyeon Heo ) , 김도희 ( Do-hee Kim ) , 배혜림 ( Hye-rim Bae )

(사)한국빅데이터학회 2024.12

한국빅데이터학회지 9권 2호 123-134(12pages)

UCI I410-151-25-02-092011212

인용하기 URL 복사 보관함 담기

미리보기

초록

다양한 매체를 통해 생성되는 비정형 데이터는 많은 정보를 내포하고 있으며, 이에 대한 활용의 필요성이 증가하고 있다. 하지만 텍스트 데이터를 효과적으로 정량화하여 예측 모델의 성능을 향상시키는 연구는 많이 이루어지고 있지 않다. 이러한 문제를 해결하기 위해 텍스트 데이터에 포함된 영향도를 정량화하여 외부 변수로 활용할 수 있는 Noun-Frequency Link Frequency 방법론을 제안한다. 제안하는 방법론은 텍스트 데이터를 활용해 주간 키워드와 키워드의 상대적 영향도를 정량화된 수치의 형태로 추출하며, 이러한 정보를 반영하여, 상하이 컨테이너 운임 지수(SCFI) 예측 모델의 성능을 향상시키는 효과적인 방법론이라는 것을 검증하였다. 본 연구를 통해, 사회적, 심리적 영향을 미치는 이벤트가 텍스트 데이터에 등장하였을 때, 이러한 정보를 포착하고 예측 성능을 향상시킴과 동시에 등장하는 키워드들을 분석하여 해석 가능성을 높일 수 있다.

The vast volume of unstructured data generated by various media sources presents significant opportunities for enhancing predictive models. However, there remains a notable gap in research on effectively quantifying text data to improve model performance. To address this issue, this study proposes the Noun-Frequency Link-Frequency (NFLF) methodology, which quantifies the influence embedded in text data and incorporates it as an external variable. The methodology extracts weekly keywords and their relative influence as measurable values from text data. Incorporating this data, the study demonstrates the effectiveness of the proposed approach in improving the forecasting performance of the Shanghai Containerized Freight Index (SCFI). The findings highlight the potential of leveraging text-encoded social information for predictive modeling in the shipping and logistics industry.

키워드

Time-series Forecasting

Artificial Intelligence

Ⅰ. 서론
Ⅱ. 선행 연구
Ⅲ. 연구 방법론
Ⅳ. 실험
Ⅴ. 결론
참 고 문 헌

참고문헌 (0)

[자료제공 : 네이버학술정보]