우선적 경험 재생 방식을 이용한 병목 구간 통과 자율주행 정책 연구
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 엄찬인 | - |
dc.contributor.author | 이동수 | - |
dc.contributor.author | 권민혜 | - |
dc.date.accessioned | 2023-07-10T07:40:05Z | - |
dc.date.available | 2023-07-10T07:40:05Z | - |
dc.date.issued | 2023-06 | - |
dc.identifier.issn | 1226-4717 | - |
dc.identifier.issn | 2287-3880 | - |
dc.identifier.uri | https://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/44076 | - |
dc.description.abstract | 인공지능을 활용한 자율주행 연구가 가속화됨에 따라, 도로 정체와 같은 복잡한 환경에서 주행 가능한 자율주행 기술에 대한 수요가 증가하고 있다. 이에 고차원의 상태정보에 즉각적인 의사결정이 가능한 심층강화학습(deep reinforcement learning) 기반의 자율주행 연구가 주목을 받고 있다. 본 연구에서는 교통 정체가 빈번히 발생하는병목구간의 성공적인 통과를 위한 부분 관측가능한 마르코프 의사결정과정(Partially Observable Markov Decision Process; POMDP)을 제안한다. 정책 학습에는 Twin Delayed Deep Deterministic Policy Gradient(TD3) 알고리즘을 사용하며, 우선적 경험 재생(prioritized experience replay) 기반의 샘플링 방식을 사용한다. 결과적으로 우선적경험 재생 기반의 자율주행차량이 무작위(random) 경험 재생 기반 개체보다 복잡한 도로에서 우수한 성능을 보임을 확인하였다. | - |
dc.format.extent | 14 | - |
dc.language | 한국어 | - |
dc.language.iso | KOR | - |
dc.publisher | 한국통신학회 | - |
dc.title | 우선적 경험 재생 방식을 이용한 병목 구간 통과 자율주행 정책 연구 | - |
dc.title.alternative | Autonomous Driving Strategy for Bottleneck Traffic with Prioritized Experience Replay | - |
dc.type | Article | - |
dc.identifier.doi | 10.7840/kics.2023.48.6.690 | - |
dc.identifier.bibliographicCitation | 한국통신학회논문지, v.48, no.6, pp 690 - 703 | - |
dc.identifier.kciid | ART002966631 | - |
dc.citation.endPage | 703 | - |
dc.citation.number | 6 | - |
dc.citation.startPage | 690 | - |
dc.citation.title | 한국통신학회논문지 | - |
dc.citation.volume | 48 | - |
dc.identifier.url | https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE11433816&language=ko_KR&hasTopBanner=true | - |
dc.publisher.location | 대한민국 | - |
dc.description.isOpenAccess | N | - |
dc.subject.keywordAuthor | Autonomous driving system | - |
dc.subject.keywordAuthor | Bottleneck traffic | - |
dc.subject.keywordAuthor | Deep reinforcement learning | - |
dc.subject.keywordAuthor | Partially observable Markov decision process | - |
dc.subject.keywordAuthor | Twin delayed deep deterministic policy gradient | - |
dc.subject.keywordAuthor | Prioritized experience replay | - |
dc.description.journalRegisteredClass | kci | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
Soongsil University Library 369 Sangdo-Ro, Dongjak-Gu, Seoul, Korea (06978)02-820-0733
COPYRIGHT ⓒ SOONGSIL UNIVERSITY, ALL RIGHTS RESERVED.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.