Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

입술 영역의 움직임과 밝기 변화를 이용한 음성구간 검출 알고리즘 개발Voice Activity Detection using Motion and Variation of Intensity in The Mouth Region

Other Titles
Voice Activity Detection using Motion and Variation of Intensity in The Mouth Region
Authors
김기백유제웅조남익
Issue Date
May-2012
Publisher
한국방송∙미디어공학회
Keywords
Visual voice activity detection; Optical flow; Intensity variation; Visual voice activity detection; Optical flow; Intensity variation
Citation
방송공학회 논문지, v.17, no.3, pp.519 - 528
Journal Title
방송공학회 논문지
Volume
17
Number
3
Start Page
519
End Page
528
URI
http://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/12818
DOI
10.5909/JBE.2012.17.3.519
ISSN
1226-7953
Abstract
음성구간을 검출하는 일반적인 방법은 음향신호로부터 특징값을 추출하여 판별식을 거치는 것이다. 그러나 잡음이 많은 환경에서 그 성능은 당연히 저하되며, 이 경우 영상신호를 이용하거나 영상과 음성을 동시에 사용함으로써 성능향상을 도모할 수 있다. 영상신호를 이용하여 음성구간을 검출하는 기존 방법들에서는 액티브 어피어런스 모델, 옵티컬 플로우, 밝기 변화 등 주로 하나의 특징값을 이용하고 있다. 그러나 음성구간의 참값은 음향신호에 의해 결정되므로 한 가지의 영상정보만으로는 음성구간을 검출하는데 한계를 보이고 있다. 본 논문에서는 입술 영역의 옵티컬 플로우와 밝기 변화 두 가지 영상정보로부터 특징값을 추출하고, 추출된 특징값들을 결합하여 음성구간을 검출하는 알고리즘을 제안하고자 한다. 또한, 음성구간 검출 알고리즘이 다른 시스템의 전처리로 활용되는 경우에 적은 계산량만으로 수행되는 것이 바람직하므로, 통계적 모델링에 의한 방법보다는 추출된 특징값으로부터 간단한 대수적 연산만으로 스코어를 산정하여 문턱값과 비교하는 방법을 제안하고자 한다. 입술 영역 검출을 위해서는 얼굴에서 가장 두드러진 특징점을 갖는 눈을 먼저 검출한 후, 얼굴의 구조와 밝기값을 이용하는 알고리즘을 제안하였다. 실험 결과 본 논문에서 제안하는 두 가지 특징값을 결합한 음성구간 검출 알고리즘이 하나의 특징값만을 이용했을 때보다 우수한 성능을 보임을 확인할 수 있다.
Files in This Item
Go to Link
Appears in
Collections
College of Engineering > School of Electrical Engineering > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Kim, Gibak photo

Kim, Gibak
College of Engineering (School of Electrical Engineering)
Read more

Altmetrics

Total Views & Downloads

BROWSE