VAE의 잠재 변수를 활용한 비지도 기반 제어 가능한 확산 모델Unsupervised Controllable Generation of Diffusion Models with Latent Variables in VAE
- Other Titles
- Unsupervised Controllable Generation of Diffusion Models with Latent Variables in VAE
- Authors
- 김민주; 김성겸; 채동규
- Issue Date
- Jun-2023
- Publisher
- 한국정보과학회
- Citation
- 2023 한국컴퓨터종합학술대회 (KCC 2023), pp.1009 - 1011
- Indexed
- OTHER
- Journal Title
- 2023 한국컴퓨터종합학술대회 (KCC 2023)
- Start Page
- 1009
- End Page
- 1011
- URI
- https://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/190028
- Abstract
- 최근 확산확률모델 (Diffusion Probabilistic Models)이 여러 이미지 생성모델 중 가장 좋은 성능을 보이고 있으며 활발히 연구되고 있다. 그 중에서도 트랜스포머를 이용한, 텍스트 설명에 기반한 이미지 생성이 집중적으로 연구되고 있다. 그러나 텍스트 기반으로 훈련된 확산확률모델은 다른 생성 모델들과 비교해 좋은 품질의 이미지를 생성하고 사용자가 원하는 이미지를 생성할 수 있도록 제어하는 것에는 용이하나, 모델의 크기가 너무 크다는 단점이 존재한다. 따라서 본 논문에서는 기존의 Beta-VAE의 특성분리된잠재변수 (disentangled latent variables) 를 이용하여 확산모델을 비지도 방식으로 제어하는 방법을 제안한다. Diffusion Autoencoder의 구조를 참고해 Beta-VAE의 잠재변수를 확산 모델에 추가 하였으며,InfoGAN의 손실 함수를 참고하여 확산모델의 훈련에 잠재변수를 반영하였다. 실험 결과 제안하는 방법은 데이터 레이블 없이도 확산모델을 통해 의미론 적인 특징을 제어하며 이미지를 생성할 수 있었다.
- Files in This Item
-
Go to Link
- Appears in
Collections - 서울 공과대학 > 서울 컴퓨터소프트웨어학부 > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.