Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

데이터 증강기법을 이용한 음성 위조 공격 탐지모형의 성능 향상에 대한 연구Data augmentation in voice spoofing problem

Authors
곽일엽최효정
Issue Date
Jun-2021
Publisher
한국통계학회
Keywords
voice spoofing detection; data augmentation; deep learning; audio data; 음성 위조 탐지모형; 데이터 증강기법; 딥러닝; 음성자료
Citation
응용통계연구, v.34, no.3, pp 449 - 460
Pages
12
Journal Title
응용통계연구
Volume
34
Number
3
Start Page
449
End Page
460
URI
https://scholarworks.bwise.kr/cau/handle/2019.sw.cau/62384
DOI
10.5351/KJAS.2021.34.3.449
ISSN
1225-066X
2383-5818
Abstract
본 논문에서는 음성위조공격탐지(Voice spoofing detection) 문제에 데이터 증강을 적용한다. ASVspoof 2017은 리플레이 공격 탐지에 대해 다루며 진짜 사람의 음성과 환경이나 녹음, 재생 장치의 조건들을 다르게하여 위조한 가짜 음성을 분류하는 것을 목적으로 한다. 지금까지 이미지 데이터에 대한 데이터 증강 연구가 활발히 이루어졌으며 음성에도 데이터 증강을 시도하는 여러 연구가 진행되어왔다. 하지만 음성 리플레이 공격에 대한 데이터 증강시도는 이루어지지 않아 본 논문에서는 데이터 증강기법을 통한 오디오 변형이 리플레이 공격 탐지에 어떠한 영향을 미치는지에 대해 탐구해본다. 총 7가지의 데이터 증강기법을 적용해보았으며 그 중 DVC, Pitch 음성 증강기법이 성능향상에 도움되었다. DVC와 Pitch는 기본 모델 EER의 약 8% 개선을 보여주었으며, 특히 DVC는 57개의 환경변수 중 일부 환경에서 눈에 띄는 정확도 향상이 있었다. 가장 큰 폭으로 증가한 RC53의 경우 DVC가 기본 모델 정확도의 약 45% 향상을 이끌어내며 기존에 탐지하기 어려웠던 고사양의 녹음, 재생 장치를 잘 구분해냈다. 본 연구를 토대로 기존에 증강기법의 효과에 대한 연구가 이루어지지 않았던 음성 위조 탐지 문제에서 DVC, Pitch 데이터 증강기법이 성능 향상에 도움이 된다는 것을 알아내었다.
Files in This Item
There are no files associated with this item.
Appears in
Collections
College of Business & Economics > Department of Applied Statistics > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Kwak, Il-Youp photo

Kwak, Il-Youp
대학원 (통계데이터사이언스학과)
Read more

Altmetrics

Total Views & Downloads

BROWSE