자율주행 차량 시뮬레이션에서의 강화학습을 위한 상태표현 성능 비교Comparing State Representation Techniques for Reinforcement Learning in Autonomous Driving
- Other Titles
- Comparing State Representation Techniques for Reinforcement Learning in Autonomous Driving
- Authors
- 안지환; 권태수
- Issue Date
- Jul-2024
- Publisher
- (사)한국컴퓨터그래픽스학회
- Keywords
- Autonomous driving; Reinforcement learning; State representation; Simulation; Virtual environment; 자율주행; 강화학습; 상태 표현; 시뮬레이션; 가상환경
- Citation
- 한국컴퓨터그래픽스학회논문지, v.30, no.3, pp 109 - 123
- Pages
- 15
- Indexed
- KCI
- Journal Title
- 한국컴퓨터그래픽스학회논문지
- Volume
- 30
- Number
- 3
- Start Page
- 109
- End Page
- 123
- URI
- https://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/209948
- DOI
- 10.15701/kcgs.2024.30.3.109
- ISSN
- 1975-7883
2383-529X
- Abstract
- 딥러닝과 강화학습을 활용한 비전 기반 엔드투엔드 자율주행 시스템 관련 연구가 지속적으로 증가하고 있다. 일반적으로 이러한 시스템은 위치, 속도, 방향, 센서 데이터 등 연속적이고 고차원적인 차량의 상태를 잠재 특징 벡터로 인코딩하고, 이를 차량의 주행 정책으로 디코딩하는 두 단계로 구성된다. 도심 주행과 같이 다양하고 복잡한 환경에서는Variational Autoencoder(VAE)나 Convolutional Neural Network(CNN)과 같은 네트워크를 이용한 효율적인 상태 표현방법의 필요성이 더욱 부각된다. 본 논문은 차량의 이미지 상태 표현이 강화학습 성능에 미치는 영향을 분석하였다.
CARLA 시뮬레이터 환경에서 실험을 수행하였고, 차량의 전방 카메라 센서로부터 취득한 RGB 이미지 및 Semantic Segmented 이미지를 각각 VAE와 Vision Transformer(ViT) 네트워크로 특징 추출하여 상태 표현 학습에 활용하였다. 이러한 방법론이 강화학습에 미치는 영향을 실험하여, 데이터 유형과 상태 표현 기법이 자율주행의 학습 효율성과 결정능력 향상에 어떤 역할을 하는지를 실험하였다.
Research into vision-based end-to-end autonomous driving systems utilizing deep learning and reinforcement learning has been steadily increasing. These systems typically encode continuous and high-dimensional vehicle states, such as location, velocity, orientation, and sensor data, into latent features, which are then decoded into a vehicular control policy. The complexity of urban driving environments necessitates the use of state representation learning through networks like Variational Autoencoders (VAEs) or Convolutional Neural Networks (CNNs). This paper analyzes the impact of different image state encoding methods on reinforcement learning performance in autonomous driving. Experiments were conducted in the CARLA simulator using RGB images and semantically segmented images captured by the vehicle’s front camera. These images were encoded using VAE and Vision Transformer (ViT) networks. The study examines how these networks influence the agents’ learning outcomes and experimentally demonstrates the role of each state representation technique in enhancing the learning efficiency and decision- making capabilities of autonomous driving systems.
- Files in This Item
-
Go to Link
- Appears in
Collections - 서울 공과대학 > 서울 컴퓨터소프트웨어학부 > 1. Journal Articles

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.