Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

SimKoR: 한국어 리뷰 데이터를 활용한 문장 유사도 데이터셋 제안 및 대조학습에서의 활용 방안

Full metadata record
DC Field Value Language
dc.contributor.author김재민-
dc.contributor.author나요한-
dc.contributor.author김강민-
dc.contributor.author이상락-
dc.contributor.author채동규-
dc.date.accessioned2023-08-07T07:50:57Z-
dc.date.available2023-08-07T07:50:57Z-
dc.date.created2023-07-20-
dc.date.issued2022-10-
dc.identifier.urihttps://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/188943-
dc.description.abstract최근 자연어 처리 분야에서 문맥적 의미를 반영하기 위한 대조학습 (contrastive learning) 에 대한 연구가 활발히이뤄지고 있다. 이 때 대조학습을 위한 양질의 학습 (training) 데이터와 검증 (validation) 데이터를 이용하는 것이 중요하다. 그러나 한국어의 경우 대다수의 데이터셋이 영어로 된 데이터를 한국어로 기계 번역하여 검토 후제공되는 데이터셋 밖에 존재하지 않는다. 이는 기계번역의 성능에 의존하는 단점을 갖고 있다. 본 논문에서는한국어 리뷰 데이터로 임베딩의 의미 반영 정도를 측정할 수 있는 간단한 검증 데이터셋 구축 방법을 제안하고,이를 활용한 데이터셋인 SimKoR (Similarity Korean Review dataset) 을 제안한다. 제안하는 검증 데이터셋을 이용해서 대조학습을 수행하고 효과성을 보인다.-
dc.language한국어-
dc.language.isoko-
dc.publisher한국정보과학회-
dc.titleSimKoR: 한국어 리뷰 데이터를 활용한 문장 유사도 데이터셋 제안 및 대조학습에서의 활용 방안-
dc.typeArticle-
dc.contributor.affiliatedAuthor채동규-
dc.identifier.bibliographicCitation제34회 한글 및 한국어 정보처리 학술대회 (HCLT 2022), pp.245 - 248-
dc.relation.isPartOf제34회 한글 및 한국어 정보처리 학술대회 (HCLT 2022)-
dc.citation.title제34회 한글 및 한국어 정보처리 학술대회 (HCLT 2022)-
dc.citation.startPage245-
dc.citation.endPage248-
dc.type.rimsART-
dc.type.docTypeProceeding-
dc.description.journalClass3-
dc.description.isOpenAccessN-
dc.description.journalRegisteredClassother-
dc.subject.keywordAuthor자연어처리-
dc.subject.keywordAuthor대조학습-
dc.subject.keywordAuthor평가지표-
dc.subject.keywordAuthor감정분석-
dc.subject.keywordAuthor평가 데이터셋-
dc.identifier.urlhttp://www.hclt.kr/symp/?lnb=conference-
Files in This Item
Go to Link
Appears in
Collections
서울 공과대학 > 서울 컴퓨터소프트웨어학부 > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Chae, Dong Kyu photo

Chae, Dong Kyu
COLLEGE OF ENGINEERING (SCHOOL OF COMPUTER SCIENCE)
Read more

Altmetrics

Total Views & Downloads

BROWSE