Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

대규모 언어모델을 활용한 데이터셋 생성을 위한 프롬프트 디자인 및 생성 방법론 분석

Full metadata record
DC Field Value Language
dc.contributor.author김강민-
dc.contributor.author채동규-
dc.date.accessioned2023-09-04T07:58:10Z-
dc.date.available2023-09-04T07:58:10Z-
dc.date.created2023-07-20-
dc.date.issued2023-06-
dc.identifier.urihttps://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/190027-
dc.description.abstract최근 데이터셋 생성을 위해 대규모 언어모델을 활용하여 양질의 데이터를 얻는 여러 방법들이 연구되어왔다. 본 논문에서는 기존의 여러 방법들 중, 언어모델의 능력을 가장 잘 이끌어 낼 수 있는 프롬프트를설계하는 방법과 그 유형을 정리한다. 또한, 토큰 생성 확률을 self-debiasing 방법론을 통해 조정하여각기 다른 과제(task)에 적합한 데이터셋을 만드는 방법론을 적용한다. 이 두가지 방법론들을 활용해 대규모 언어모델을 활용한 한국어 데이터셋 제작 시 고려해야 할 사항들을 탐구한다-
dc.language한국어-
dc.language.isoko-
dc.publisher한국정보과학회-
dc.title대규모 언어모델을 활용한 데이터셋 생성을 위한 프롬프트 디자인 및 생성 방법론 분석-
dc.title.alternativePrompt Designing and Analysis on Generation Method for Dataset Generation by Large Language models-
dc.typeArticle-
dc.contributor.affiliatedAuthor채동규-
dc.identifier.bibliographicCitation2023 한국컴퓨터종합학술대회 (KCC 2023), pp.337 - 339-
dc.relation.isPartOf2023 한국컴퓨터종합학술대회 (KCC 2023)-
dc.citation.title2023 한국컴퓨터종합학술대회 (KCC 2023)-
dc.citation.startPage337-
dc.citation.endPage339-
dc.type.rimsART-
dc.type.docTypeProceeding-
dc.description.journalClass3-
dc.description.isOpenAccessN-
dc.description.journalRegisteredClassother-
dc.identifier.urlhttps://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE11488030-
Files in This Item
Go to Link
Appears in
Collections
서울 공과대학 > 서울 컴퓨터소프트웨어학부 > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Chae, Dong Kyu photo

Chae, Dong Kyu
COLLEGE OF ENGINEERING (SCHOOL OF COMPUTER SCIENCE)
Read more

Altmetrics

Total Views & Downloads

BROWSE