결측치 비율이 높은 시계열 데이터 분석 및 예측을 위한 머신러닝 모델 구축Development of a Machine Learning Model for Imputing Time Series Data with Massive Missing Values
- Other Titles
- Development of a Machine Learning Model for Imputing Time Series Data with Massive Missing Values
- Authors
- 고방원; 한용희
- Issue Date
- Jun-2024
- Publisher
- 한국정보전자통신기술학회
- Keywords
- Imputing; Machine learning; Missing values; Missingness; Time series data
- Citation
- 한국정보전자통신기술학회 논문지, v.17, no.3, pp 176 - 182
- Pages
- 7
- Journal Title
- 한국정보전자통신기술학회 논문지
- Volume
- 17
- Number
- 3
- Start Page
- 176
- End Page
- 182
- URI
- https://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/49813
- DOI
- 10.17661/jkiiect.2024.17.3.176
- ISSN
- 2005-081X
2288-9302
- Abstract
- 본 연구는 결측치 비율이 높은 시계열 데이터를 효과적으로 분석하고 예측할 수 있는 머신러닝 모델을 구축하기 위해 다양한 결측치 처리 방법을 비교 분석하였다. 이를 위해 PSMF(Predictive State Model Filtering), MissForest, IBFI(Imputation By Feature Importance) 방법을 적용하였으며, 이후 LightGBM, XGBoost, EBM(Explainable Boosting Machines) 머신러닝 모델을 사용하여 예측 성능을 평가하였다. 연구 결과, 결측치 처리 방법 중에서는 MissForest와 IBFI가 비선형적 데이터 패턴을 잘 반영하여 가장 높은 성능을 나타냈으며, 머신러닝 모델 중에서는 XGBoost와 EBM 모델이 LightGBM 모델보다 더 높은 성능을 보였다. 본 연구는 결측치 비율이 높은 시계열 데이터의 분석 및 예측에 있어 비선형적 결측치 처리 방법과 머신러닝 모델의 조합이 중요함을 강조하며, 실무적으로 유용한 방법론을 제시하였다.
- Files in This Item
-
Go to Link
- Appears in
Collections - Graduate School > Department of Entrepreneurship & Small Business > 1. Journal Articles
![qrcode](https://api.qrserver.com/v1/create-qr-code/?size=55x55&data=https://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/49813)
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.