Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

결측치 비율이 높은 시계열 데이터 분석 및 예측을 위한 머신러닝 모델 구축Development of a Machine Learning Model for Imputing Time Series Data with Massive Missing Values

Other Titles
Development of a Machine Learning Model for Imputing Time Series Data with Massive Missing Values
Authors
고방원한용희
Issue Date
Jun-2024
Publisher
한국정보전자통신기술학회
Keywords
Imputing; Machine learning; Missing values; Missingness; Time series data
Citation
한국정보전자통신기술학회 논문지, v.17, no.3, pp 176 - 182
Pages
7
Journal Title
한국정보전자통신기술학회 논문지
Volume
17
Number
3
Start Page
176
End Page
182
URI
https://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/49813
DOI
10.17661/jkiiect.2024.17.3.176
ISSN
2005-081X
2288-9302
Abstract
본 연구는 결측치 비율이 높은 시계열 데이터를 효과적으로 분석하고 예측할 수 있는 머신러닝 모델을 구축하기 위해 다양한 결측치 처리 방법을 비교 분석하였다. 이를 위해 PSMF(Predictive State Model Filtering), MissForest, IBFI(Imputation By Feature Importance) 방법을 적용하였으며, 이후 LightGBM, XGBoost, EBM(Explainable Boosting Machines) 머신러닝 모델을 사용하여 예측 성능을 평가하였다. 연구 결과, 결측치 처리 방법 중에서는 MissForest와 IBFI가 비선형적 데이터 패턴을 잘 반영하여 가장 높은 성능을 나타냈으며, 머신러닝 모델 중에서는 XGBoost와 EBM 모델이 LightGBM 모델보다 더 높은 성능을 보였다. 본 연구는 결측치 비율이 높은 시계열 데이터의 분석 및 예측에 있어 비선형적 결측치 처리 방법과 머신러닝 모델의 조합이 중요함을 강조하며, 실무적으로 유용한 방법론을 제시하였다.
Files in This Item
Go to Link
Appears in
Collections
Graduate School > Department of Entrepreneurship & Small Business > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Han, Yong Hee photo

Han, Yong Hee
College of Business Administration (Department of Entrepreneurship & Small Business)
Read more

Altmetrics

Total Views & Downloads

BROWSE