분류 성능 향상을 위한 비감독학습 기반의 패턴 선택Pattern Selection based on Unsupervised Learning for Improving the Performance of Classification
- Other Titles
- Pattern Selection based on Unsupervised Learning for Improving the Performance of Classification
- Authors
- 김만선; 주복규
- Issue Date
- 2007
- Publisher
- 한국인터넷방송통신학회
- Keywords
- Pattern Selection; Data Mining; Classification; Sampling; SOM; Pattern Selection; Data Mining; Classification; Sampling; SOM
- Citation
- 한국인터넷방송통신학회 논문지, v.7, no.2, pp.19 - 25
- Journal Title
- 한국인터넷방송통신학회 논문지
- Volume
- 7
- Number
- 2
- Start Page
- 19
- End Page
- 25
- URI
- https://scholarworks.bwise.kr/hongik/handle/2020.sw.hongik/24027
- ISSN
- 2289-0238
- Abstract
- 패턴 선택은 주어진 전체 학습 패턴으로부터 일부 유용한 패턴들을 추출하여 학습에 이용하는 방법이다. 분류 문제에서 유용한 학습패턴은 클래스들 간의 분류경계에 근접하거나 클래스의 중심 부근에 속한 패턴을 정상패턴이라고 한다. 이러한 패턴 중에서 노이즈 패턴이 포함된다면 분류 모델의 성능을 저하시킨다. 제안하는 방법은 노이즈를 제거하는 일종의 전처리 작업으로서 기존의 샘플링 방법을 사용하지 않고, 비감독 학습을 도입하여 노이즈 데이터를 제거한다. 그 결과 선택된 데이터로 학습할 경우, 학습 데이터 수 감소로 인한 계산 시간 단축 및 메모리 공간 절약의 효과 그리고 클래스 불균형 문제에서 불균형 비율을 감소시키는 효과가 있다. 제안하는 방법의 효율성을 알아보기 위하여 인공 데이터와 실제 문제에 적용하였다. 적용 결과 breast cancer 데이터는 전체 데이터수의 54%를 제거하였어도 정확률, 재현율, F1 값이 모두 향상되었다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - 교학처 > 교양과(세종) > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.