Softmax와 UCB 알고리즘의 결합을 통한 성능 개선 연구-베이지안 확률론을 이용하여-A Study on Performance Improvement with Combination of Softmax and UCB Algorithm -Using Bayesian Statistics-
- Other Titles
- A Study on Performance Improvement with Combination of Softmax and UCB Algorithm -Using Bayesian Statistics-
- Authors
- 박주원; 김재범; 최용락
- Issue Date
- Feb-2018
- Publisher
- 한국IT정책경영학회
- Keywords
- A/B testing; Multi-Armed Bandit problem; Softmax algorithm; UCB algorithm; Bayesian Statistics; A/B테스트; 다중 슬롯머신 문제; 소프트맥스 알고리즘; 신뢰상한 알고리즘; 베이지안 확률론
- Citation
- 한국IT정책경영학회 논문지, v.10, no.1, pp.649 - 654
- Journal Title
- 한국IT정책경영학회 논문지
- Volume
- 10
- Number
- 1
- Start Page
- 649
- End Page
- 654
- URI
- http://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/31944
- ISSN
- 2234-0564
- Abstract
- 대형 웹사이트에서 아이디어를 대조군과 비교 실험하기 위한 방법으로 A/B테스트가 주목받고 있다. 일반적인 A/B테스트는 테스트할 모든 버전에 사용자들을 동일하게 할당하여 진행한다. 그러나 테스트 도중의 결과가 매우 안 좋은 버전이라 하더라도, 여전히 다른 버전과 균등하게 사용자들을 할당받는다. 이는 실험기간이 길어질수록 기회비용이 커지는 것을 의미한다. 이러한 문제를 해결하기 위해 제기된 것이 Multi-Armed Bandit 문제다. A/B테스트의 기회비용 문제와 관련되어 있는, Multi-Armed Bandit의 탐색과 활용의 딜레마를 풀기 위한 대표적인 알고리즘으로 UCB 알고리즘이 있다. 하지만 시행횟수가 제한되고 많은 버전을 테스트해야 하는 상황에서 UCB 알고리즘은 비효율적인 시행이 발생하여 만족스럽지 못한 결과를 낼 가능성이 높다. 이러한 문제를 해결하기 위해 본 논문에서는 Multi-Armed Bandit 알고리즘 중 하나인 Softmax 알고리즘에서 베이지안 확률론을 이용하여 우수한 버전을 선출한 뒤, UCB 알고리즘으로 전환하는 Softmax/UCB 알고리즘을 제시한다.
- Files in This Item
-
Go to Link
- Appears in
Collections - Graduate School of Software > Major in Software > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.