대용량 한글 문장 인식률 향상을 위한 연구A Study for Improving Recognition Rate of Large Vocabulary
- Other Titles
- A Study for Improving Recognition Rate of Large Vocabulary
- Authors
- 윤여민; 손경환; 권영헌; 이건상
- Issue Date
- Dec-2006
- Publisher
- 한양대학교 이학기술연구소
- Keywords
- 한글 문장 인식; HMM; 삼중음소
- Citation
- 이학기술연구지, v.9, pp 1 - 4
- Pages
- 4
- Indexed
- DOMESTIC
- Journal Title
- 이학기술연구지
- Volume
- 9
- Start Page
- 1
- End Page
- 4
- URI
- https://scholarworks.bwise.kr/erica/handle/2021.sw.erica/44441
- ISSN
- 2005-9051
- Abstract
- 본 연구는 대용량 한글 문장 인식률 향상을 위한 연구이다. 기존 단일음소 기반에 비해 향상된 인식률을 얻기 위해 삼중음소 기반에서 Gaussian Mixture를 확장시켜 이에 대한 인식률을 구했다. 이를 위해 한글 어휘의 체계적인 분석기인 '한양 한국어 분석기(H2MA)'를 이용했으며, 특 징벡터는 MFCC(mel-frequency ceptral coefficients) 39차를 이용했다. 음성 Database의 훈련 및 인식 과정은 HTK(Hidden Markov Model Tool Kit)를 사용하였고, 음성 Database는 문장의 평균 길이가 7.43어절인 성인남녀 음성 2만여 문장으로 구성하였다. 실험결과 Gaussian Mixture를 확장 하기 전에는 단일음소 기반의 인식률이 삼중음소 기반의 인식률 보다 0.36% 높았지만 Gaussian Mixture를 6개까지 확장 한 경우, 삼중음소 기반의 인식률이 단일음소 기반의 인식률보다 1.3% 높았다.
In this study, we consider how to improve recognition rate of large vocabulary Korean sentences. In order to obtain better recognition rate compared to monophone based state, we use triphone based state with increasing number of Gaussian Mixtures. For the purpose of systematic analysis of Korean lexicon, we apply Hanyang Korean analyzer H2MA. In experiment, we transform speech data into the feature vector of mel-frequency ceptral coefficients(MFCC). HTK is used for training and recognizing database, composed of about 20000 sentences with average lengths of 7.43 clauses. When we use 6 Gaussian Mixture, recognition rate of triphone state would show 1.3% higher recognition rate than that of monophone state.
- Files in This Item
-
Go to Link
- Appears in
Collections - COLLEGE OF SCIENCE AND CONVERGENCE TECHNOLOGY > DEPARTMENT OF APPLIED PHYSICS > 1. Journal Articles

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.