Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

ReLU가 합성된 행렬 곱 연산의 부분 생략을 통한 딥 러닝 모델 추론 시간 개선Improving the Inference Time of the Deep Learning Model with Partial Skip of ReLU-fused Matrix Multiplication Operations

Other Titles
Improving the Inference Time of the Deep Learning Model with Partial Skip of ReLU-fused Matrix Multiplication Operations
Authors
김성균안건주김나훈서지원
Issue Date
Mar-2022
Publisher
한국정보과학회
Keywords
딥 러닝 최적화; 계산 생략; 완전 연결 레이어; 추론 최적화; deep learning optimization; omitted computation; fully-connected layer; inference optimization
Citation
정보과학회 컴퓨팅의 실제 논문지, v.28, no.3, pp.139 - 145
Indexed
KCI
Journal Title
정보과학회 컴퓨팅의 실제 논문지
Volume
28
Number
3
Start Page
139
End Page
145
URI
https://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/139226
DOI
10.5626/KTCP.2022.28.3.139
ISSN
2383-6318
Abstract
최근 딥 러닝의 활용 분야가 넓어지는 추세이며, 많은 파라미터들을 가지고 있는 Large-Scale 딥 러닝 모델들이 좋은 성능을 보이는 경향이 있다. 그리고 크기가 큰 모델을 이용한 딥 러닝 추론은 필연적으로 많은 자원과 긴 시간을 요구하므로 딥 러닝 모델의 효율적인 활용을 위해서는 추론 시간의 단축이 필수적으로 요구된다. 본 논문에서는 딥 러닝 추론 과정에서 활성화 함수인 Rectified Linear Unit 과 행렬 곱을 융합하고, 두 연산과정에서 계산할 출력 값의 부호를 미리 예측하여 계산의 양을 줄이는 네 가지 방법을 제안하며, 네 가지 계산 생략 방법의 비교를 통해 정확도를 거의 해치지 않는 선에서 계산의 양을 줄여 추론 시간을 절약하는 최적의 방안을 도출한다.
Files in This Item
Go to Link
Appears in
Collections
서울 공과대학 > 서울 컴퓨터소프트웨어학부 > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Seo, Ji won photo

Seo, Ji won
COLLEGE OF ENGINEERING (SCHOOL OF COMPUTER SCIENCE)
Read more

Altmetrics

Total Views & Downloads

BROWSE