Modified ECCD 및 문서별 범주 가중치를 이용한 문서 분류 시스템A Document Classification System Using Modified ECCD and Category Weight for each Document
- Other Titles
- A Document Classification System Using Modified ECCD and Category Weight for each Document
- Authors
- 한정석; 박상용; 이수원
- Issue Date
- Aug-2012
- Publisher
- 한국정보처리학회
- Keywords
- Document Classification; Feature Selection; ECCD; 문서 분류; 자질어; 범주; ECCD
- Citation
- 정보처리학회논문지. 소프트웨어 및 데이터 공학, v.19, no.4, pp.237 - 242
- Journal Title
- 정보처리학회논문지. 소프트웨어 및 데이터 공학
- Volume
- 19
- Number
- 4
- Start Page
- 237
- End Page
- 242
- URI
- http://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/12945
- DOI
- 10.3745/KIPSTB.2012.19B.4.237
- ISSN
- 2287-5905
- Abstract
- 웹 문서 정보 서비스는 관리자의 효율적 문서관리와 사용자의 문서검색 편의성을 위해 문서 분류 시스템을 필요로 한다. 기존의 문서 분류시스템은 분류하고자 하는 문서 내 선택된 자질어의 개수가 적거나, 특정 범주의 문서 비율이 높아 그 범주에서 대부분의 자질어가 선택되어모델이 생성된 경우 분류 정확도가 저하되는 문제점을 가진다. 이러한 문제점을 해결하기 위해 본 논문에서는 ‘Modified ECCD’ 기법 및 ‘문서별 범주 가중치’ 특징 변수를 사용한 문서 분류 시스템을 제안한다. 실험 결과, 제안 방법인 ‘Modified ECCD’ 기법이 및 ECCD 기법에 비해높은 분류 성능을 보였으며, ‘문서별 범주 가중치’ 특징 변수를 ‘Modified ECCD’ 기법으로 선택된 자질어 변수에 추가하여 학습하였을 경우에더 높은 분류 성능을 보였다.
- Files in This Item
-
Go to Link
- Appears in
Collections - College of Information Technology > School of Software > 1. Journal Articles
![qrcode](https://api.qrserver.com/v1/create-qr-code/?size=55x55&data=https://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/12945)
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.