NMF를 이용한 영문자 활자체 폰트 분류Font Classification of English Printed Character using Non-negative Matrix Factorization
- Other Titles
- Font Classification of English Printed Character using Non-negative Matrix Factorization
- Authors
- 이창우; 정기철; 김항준; 강현
- Issue Date
- Mar-2004
- Publisher
- 대한전자공학회
- Keywords
- Font classification; NMF; Part-based unsupervised learning; OCR; Font classification; NMF; Part-based unsupervised learning; OCR
- Citation
- 전자공학회논문지 - CI, v.41, no.02, pp.111 - 122
- Journal Title
- 전자공학회논문지 - CI
- Volume
- 41
- Number
- 02
- Start Page
- 111
- End Page
- 122
- URI
- http://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/20400
- ISSN
- 1229-6376
- Abstract
- 최근 대부분의 문서들이 전자적으로 생성되고 많은 고문서(古文書)들이 이미지 형태로 전자화되고 있다. 이미지 형태의 전자 문서들은 정보 추출과 데이터베이스화에 많은 어려움이 있기 때문에, 이러한 문서를 효율적으로 관리하고 검색하기 위한 문서구조분석 방법과 문자 인식을 위한 많은 연구가 필요하다. 본 논문은 폰트의 구분 특성(font discrimination features)들이 폰트이미지의 공간적으로 지역적인 특징들에 기반함을 가정한 방법으로써, 객체의 부분기반 표현들을 학습할 수 있는 NMF(non-negative matrix factorization) 알고리즘을 사용하여 폰트를 자동으로 분류하는 방법이다. 제안된 방법은 부분기반의 비지도 학습 방법(part-based unsupervised learning technique)을 이용하여 전체의 폰트 이미지들로부터 각 폰트들의 구분 특징인 부분을 학습하고, 학습된 부분들을 특징으로 사용하여 폰트를 분류하는 방법이다. 실험결과에서 폰트 이미지들의 공간적으로 국부적인 특징들이 조사되고, 그 특징들이 폰트의 식별을 위한 적절성을 보인다. 제안된 방법이 기존의 문자인식, 문서 검색 시스템들의 전처리기로 사용되면, 그 시스템들의 성능을 향상시킬 것으로 기대된다.
- Files in This Item
-
Go to Link
- Appears in
Collections - College of Information Technology > Global School of Media > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.