Exploring the Effectiveness of GAN-based Approach and Reinforcement Learning in Character Boxing Task캐릭터 복싱 과제에서 GAN 기반 접근법과 강화학습의 효과성 탐구
- Other Titles
- 캐릭터 복싱 과제에서 GAN 기반 접근법과 강화학습의 효과성 탐구
- Authors
- Son, Seoyoung; Kwon, Taesoo
- Issue Date
- Sep-2023
- Publisher
- (사)한국컴퓨터그래픽스학회
- Keywords
- Character Animation; Physics-based Simulation; Reinforcement Learning; GAN; 캐릭터 애니메이션; 물리기반 시뮬레이션; 강화학습; GAN
- Citation
- 한국컴퓨터그래픽스학회논문지, v.29, no.4, pp 7 - 16
- Pages
- 10
- Indexed
- KCI
- Journal Title
- 한국컴퓨터그래픽스학회논문지
- Volume
- 29
- Number
- 4
- Start Page
- 7
- End Page
- 16
- URI
- https://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/190541
- DOI
- 10.15701/kcgs.2023.29.4.7
- ISSN
- 1975-7883
2383-529X
- Abstract
- For decades, creating a desired locomotive motion in a goal-oriented manner has been a challenge in character animation. Datadriven methods using generative models have demonstrated efficient ways of predicting long sequences of motions without the need for explicit conditioning. While these methods produce high-quality long-term motions, they can be limited when it comes to synthesizing motion for challenging novel scenarios, such as punching a random target. A state-of-the-art solution to overcome this limitation is by using a GAN Discriminator to imitate motion data clips and incorporating reinforcement learning to compose goaloriented motions. In this paper, our research aims to create characters performing combat sports such as boxing, using a novel reward design in conjunction with existing GAN-based approaches. We experimentally demonstrate that both the Adversarial Motion Prior [3] and Adversarial Skill Embeddings [4] methods are capable of generating viable motions for a character punching a random target, even in the absence of mocap data that specifically captures the transition between punching and locomotion. Also, with a single learned policy, multiple task controllers can be constructed through the TimeChamber framework.
캐릭터 애니메이션 분야에서 목표 지향적 이동을 위해 원하는 궤적을 재현하는 것은 항상 어려운 과제이다. 생성 모델을사용하는 데이터 기반 방법은 명시적인 조건 없이 긴 동작 시퀀스를 예측하는 효율적인 방법 중 하나이다. 이러한 방법은고품질의 결과물을 생성해내지만, 멀리 있는 목표물을 무작위로 타격하는 것처럼 더 어려운 상황의 모션을합성(synthesis)에 있어서는 제한될 수 있다. 하지만 이는 모션 데이터 클립을 모방하는 GAN Discriminator 를 사용하고 강화학습을 통해 해결할 수 있다. 본 연구는 캐릭터들이 GAN 기반 접근법과 리워드 설계를 통해 복싱을 구현하는 것을 목표로한다. 논문에서 사용된 두 가지의 최신 연구인 Adversarial Motion Prior 와 Adversarial Skill Embedding 에 대해 비교실험하며, 또한 복싱을 경쟁 스포츠에 적용하기 위하여 멀티 에이전트 강화 학습을 위한 대규모 self-play 프레임워크인TimeChamber 를 활용한다.
- Files in This Item
-
Go to Link
- Appears in
Collections - 서울 공과대학 > 서울 컴퓨터소프트웨어학부 > 1. Journal Articles

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.