Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

Softmax와 UCB 알고리즘의 결합을 통한 성능 개선 연구-베이지안 확률론을 이용하여-A Study on Performance Improvement with Combination of Softmax and UCB Algorithm -Using Bayesian Statistics-

Other Titles
A Study on Performance Improvement with Combination of Softmax and UCB Algorithm -Using Bayesian Statistics-
Authors
박주원김재범최용락
Issue Date
Feb-2018
Publisher
한국IT정책경영학회
Keywords
A/B testing; Multi-Armed Bandit problem; Softmax algorithm; UCB algorithm; Bayesian Statistics; A/B테스트; 다중 슬롯머신 문제; 소프트맥스 알고리즘; 신뢰상한 알고리즘; 베이지안 확률론
Citation
한국IT정책경영학회 논문지, v.10, no.1, pp.649 - 654
Journal Title
한국IT정책경영학회 논문지
Volume
10
Number
1
Start Page
649
End Page
654
URI
http://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/31944
ISSN
2234-0564
Abstract
대형 웹사이트에서 아이디어를 대조군과 비교 실험하기 위한 방법으로 A/B테스트가 주목받고 있다. 일반적인 A/B테스트는 테스트할 모든 버전에 사용자들을 동일하게 할당하여 진행한다. 그러나 테스트 도중의 결과가 매우 안 좋은 버전이라 하더라도, 여전히 다른 버전과 균등하게 사용자들을 할당받는다. 이는 실험기간이 길어질수록 기회비용이 커지는 것을 의미한다. 이러한 문제를 해결하기 위해 제기된 것이 Multi-Armed Bandit 문제다. A/B테스트의 기회비용 문제와 관련되어 있는, Multi-Armed Bandit의 탐색과 활용의 딜레마를 풀기 위한 대표적인 알고리즘으로 UCB 알고리즘이 있다. 하지만 시행횟수가 제한되고 많은 버전을 테스트해야 하는 상황에서 UCB 알고리즘은 비효율적인 시행이 발생하여 만족스럽지 못한 결과를 낼 가능성이 높다. 이러한 문제를 해결하기 위해 본 논문에서는 Multi-Armed Bandit 알고리즘 중 하나인 Softmax 알고리즘에서 베이지안 확률론을 이용하여 우수한 버전을 선출한 뒤, UCB 알고리즘으로 전환하는 Softmax/UCB 알고리즘을 제시한다.
Files in This Item
Go to Link
Appears in
Collections
Graduate School of Software > Major in Software > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Choi, Yong Lak photo

Choi, Yong Lak
소프트웨어특성화대학원 (SW전공)
Read more

Altmetrics

Total Views & Downloads

BROWSE