명령어 튜닝이 대규모 언어 모델의 문장 생성에 미치는 영향력 분석
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 나요한 | - |
dc.contributor.author | 채동규 | - |
dc.date.accessioned | 2023-09-04T07:58:05Z | - |
dc.date.available | 2023-09-04T07:58:05Z | - |
dc.date.created | 2023-07-20 | - |
dc.date.issued | 2023-05 | - |
dc.identifier.issn | 2005-0011 | - |
dc.identifier.uri | https://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/190026 | - |
dc.description.abstract | 최근 대규모 언어모델 (large language models) 을 활용하여 다양한 자연어처리 문제를 추가학습없이 풀어내기 위한 zero-shot 학습에 대한 연구가 활발히 수행되고 있다. 특히 프롬프트 튜닝(prompt tuning)을 활용하여 적은 학습만으로도 효과적으로 다양한 태스크에 적응하도록 돕는 방법이 최근 대규모 언어모델의 성능을 향상시키고 있다. 본 논문은 명령어 튜닝 (instruction tuning) 이언어모델에 끼치는 영향을 분석하였다. 명령어 튜닝된 모델이 기존 언어모델과 비교하여 변화된 문장 생성 특징, 생성된 문장의 품질 등에 대한 분석을 수행하고 결과를 제시한다. | - |
dc.language | 한국어 | - |
dc.language.iso | ko | - |
dc.publisher | 한국정보처리학회 | - |
dc.title | 명령어 튜닝이 대규모 언어 모델의 문장 생성에 미치는 영향력 분석 | - |
dc.title.alternative | A Study on Instruction Tuning for Large-scale Language Models | - |
dc.type | Article | - |
dc.contributor.affiliatedAuthor | 채동규 | - |
dc.identifier.bibliographicCitation | 한국정보처리학회 ASK 2023(춘계학술발표대회), v.30, no.1, pp.684 - 686 | - |
dc.relation.isPartOf | 한국정보처리학회 ASK 2023(춘계학술발표대회) | - |
dc.citation.title | 한국정보처리학회 ASK 2023(춘계학술발표대회) | - |
dc.citation.volume | 30 | - |
dc.citation.number | 1 | - |
dc.citation.startPage | 684 | - |
dc.citation.endPage | 686 | - |
dc.type.rims | ART | - |
dc.type.docType | Proceeding | - |
dc.description.journalClass | 2 | - |
dc.description.isOpenAccess | N | - |
dc.description.journalRegisteredClass | other | - |
dc.identifier.url | https://kiss.kstudy.com/Detail/Ar?key=4028498 | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
222, Wangsimni-ro, Seongdong-gu, Seoul, 04763, Korea+82-2-2220-1365
COPYRIGHT © 2021 HANYANG UNIVERSITY.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.