ReLU가 합성된 행렬 곱 연산의 부분 생략을 통한 딥 러닝 모델 추론 시간 개선Improving the Inference Time of the Deep Learning Model with Partial Skip of ReLU-fused Matrix Multiplication Operations
- Other Titles
- Improving the Inference Time of the Deep Learning Model with Partial Skip of ReLU-fused Matrix Multiplication Operations
- Authors
- 김성균; 안건주; 김나훈; 서지원
- Issue Date
- Mar-2022
- Publisher
- 한국정보과학회
- Keywords
- 딥 러닝 최적화; 계산 생략; 완전 연결 레이어; 추론 최적화; deep learning optimization; omitted computation; fully-connected layer; inference optimization
- Citation
- 정보과학회 컴퓨팅의 실제 논문지, v.28, no.3, pp.139 - 145
- Indexed
- KCI
- Journal Title
- 정보과학회 컴퓨팅의 실제 논문지
- Volume
- 28
- Number
- 3
- Start Page
- 139
- End Page
- 145
- URI
- https://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/139226
- DOI
- 10.5626/KTCP.2022.28.3.139
- ISSN
- 2383-6318
- Abstract
- 최근 딥 러닝의 활용 분야가 넓어지는 추세이며, 많은 파라미터들을 가지고 있는 Large-Scale 딥 러닝 모델들이 좋은 성능을 보이는 경향이 있다. 그리고 크기가 큰 모델을 이용한 딥 러닝 추론은 필연적으로 많은 자원과 긴 시간을 요구하므로 딥 러닝 모델의 효율적인 활용을 위해서는 추론 시간의 단축이 필수적으로 요구된다. 본 논문에서는 딥 러닝 추론 과정에서 활성화 함수인 Rectified Linear Unit 과 행렬 곱을 융합하고, 두 연산과정에서 계산할 출력 값의 부호를 미리 예측하여 계산의 양을 줄이는 네 가지 방법을 제안하며, 네 가지 계산 생략 방법의 비교를 통해 정확도를 거의 해치지 않는 선에서 계산의 양을 줄여 추론 시간을 절약하는 최적의 방안을 도출한다.
- Files in This Item
-
Go to Link
- Appears in
Collections - 서울 공과대학 > 서울 컴퓨터소프트웨어학부 > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.