가우시안 분포에서 Maximum Log Likelihood를 이용한 벡터 양자화 기반 음성 인식 성능 향상Vector Quantization based Speech Recognition Performance Improvement using Maximum Log Likelihood in Gaussian Distribution
- Other Titles
- Vector Quantization based Speech Recognition Performance Improvement using Maximum Log Likelihood in Gaussian Distribution
- Authors
- 정경용; 오상엽
- Issue Date
- 2018
- Publisher
- 한국디지털정책학회
- Keywords
- 음성 인식; HMM; 특징 추출; 음성 모델; 가우시안 분포; Speech Recognition; HMM; Feature Extraction; Speech Model; Gaussian Distribution
- Citation
- 디지털융복합연구, v.16, no.11, pp.335 - 340
- Journal Title
- 디지털융복합연구
- Volume
- 16
- Number
- 11
- Start Page
- 335
- End Page
- 340
- URI
- https://scholarworks.bwise.kr/gachon/handle/2020.sw.gachon/4649
- DOI
- 10.14400/JDC.2018.16.11.335
- ISSN
- 1738-1916
- Abstract
- 정확한 인식률을 보이고 있는 상업적인 음성인식 시스템은 화자종속 고립데이터로부터 학습 모델을 사용한다. 그러나 잡음 환경에서 데이터양에 따라 음성인식의 성능이 저하되는 문제점이 있다. 본 논문에서는 가우시안 분포에서 Maximum Log Likelihood를 이용한 벡터 양자화 기반 음성 인식 성능 향상을 제안한다. 제안하는 방법은 음성에 대한 특징을 가지고 벡터 양자화와 Maximum Log Likelihood 음성 특징 추출 방법을 이용하여 유사 음성에 대한 음성 인식의 정확성을 높이는 최적 학습 모델 구성 방법이다. 이를 위해 HMM을 기반으로 음성 특징을 추출하는 방법을 사용한다. 제안하는 방법을 사용하여 기존 시스템에서 생성되어 사용되는 음성 모델에 대한 부정확한 음성 모델에 대한 정확성을 향상시킬 수 있으므로 음성 인식에 강인한 모델을 구성할 수 있다. 제안하는 방법은 음성 인식 시스템에서 향상된 인식의 정확도를 보인다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - IT융합대학 > 컴퓨터공학과 > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.