Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

On-sensor 이미지 신호 처리를 위한 자동화된 딥러닝 가속기 설계open accessAutomated Deep Learning Accelerator Design for On-sensor Image Signal Processing

Other Titles
Automated Deep Learning Accelerator Design for On-sensor Image Signal Processing
Authors
원동언최정욱
Issue Date
Nov-2025
Publisher
대한전자공학회
Keywords
Image signal processing; On-sensor deep learning acceleration; Automatic accelerator design
Citation
전자공학회논문지, v.62, no.11, pp 21 - 35
Pages
15
Indexed
KCI
Journal Title
전자공학회논문지
Volume
62
Number
11
Start Page
21
End Page
35
URI
https://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/217689
DOI
10.5573/ieie.2025.62.11.21
ISSN
2287-5026
2288-159X
Abstract
Deep Neural Network 기반의 Image Signal Processing (ISP-DNN)은 demosaicing 등의 기법을 활용하여 이미지 품질을 향상시키지만, 이러한 모델을 CMOS image sensor 상에 구현할 경우 고해상도 입력으로 인해 activation 저장을 위한 메모리 요구가 증가하면서 연산 및 메모리 측면에서 큰 부담을 초래한다. Layer fusion은 연속적인 연산 단계를 통합함으로써 메모리 사용량을 줄일 수 있지만, 그만큼 연산기 수가 증가하게 되며, 이는 on-sensor 환경처럼 자원이 제한된 경우에는 중요한 문제로 작용한다. 이러한 문제를 해결하기 위해, 본 논문에서는 연산 및 메모리 요구를 균형 있게 조절할 수 있는 자동화된 deep learning accelerator 설계 framework인 ISP2DLA를 제안한다. 본 framework는 line buffer 크기와 MAC (Multiply-Accumulate) unit 수를 조절하여 하드웨어 설계를 최적화하고, 두 가지 ISP-DNN 모델에 대해 gate count를 14–79% 절감함으로써 constrained resource 환경 내에서도 효율적인 on-sensor ISP model inference를 가능하게 한다.
Deep neural network-based image signal processing (ISP-DNN) improves image quality with techniques such as demosaicing, but these models pose substantial computational and memory challenges when implemented on CMOS image sensors, particularly due to the high-resolution inputs that increase memory requirements for activations. Layer fusion reduces memory usage by combining consecutive processing steps, yet it increases the required number of compute units, a critical issue in resource-limited on-sensor environments. To address these challenges, we introduce ISP2DLA, an automated deep learning accelerator design framework that balances computational and memory demands for on-sensor ISP. This framework optimizes hardware designs by adjusting line buffer sizes and the number of MAC units, reducing gate counts by 14--79% across two ISP-DNN models, thus enabling efficient on-sensor ISP model inference within constrained resources.
Files in This Item
Go to Link
Appears in
Collections
서울 공과대학 > 서울 융합전자공학부 > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Choi, Jung wook photo

Choi, Jung wook
COLLEGE OF ENGINEERING (SCHOOL OF ELECTRONIC ENGINEERING)
Read more

Altmetrics

Total Views & Downloads

BROWSE