Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

대체 토큰 감지 모델을 통한 대체어 추출Lexical Substitution Using a Replaced Token Detection Model

Other Titles
Lexical Substitution Using a Replaced Token Detection Model
Authors
지승현이수원
Issue Date
Apr-2023
Publisher
한국정보과학회
Keywords
대체어 추출; 대체어; 언어 모델; lexical substitution; alternative word; language model
Citation
정보과학회논문지, v.50, no.4, pp.321 - 328
Journal Title
정보과학회논문지
Volume
50
Number
4
Start Page
321
End Page
328
URI
http://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/43782
DOI
10.5626/JOK.2023.50.4.321
ISSN
2383-630X
Abstract
대체어란 한 문장에서 특정 단어를 대신하여 사용해도 문장의 의미를 훼손하지 않는 단어이며, 이를 추출하는 기술은 데이터 증강 등 다양한 자연어처리 문제에 활용할 수 있다. 기존 대체어 추출 방법은 문맥에 부자연스러운 대체어를 추출할 수 있다는 문제가 있다. 이를 해결하기 위해 본 논문에서는 말뭉치에서 목표 단어가 포함된 문장을 샘플링하여 사전학습 BERT 기반 대체어 후보 생성 모델에 입력하고, 대체 토큰 감지 모델로 부적합한 대체어를 제외하여 대체어를 추출하는 방법을 제안한다. 국립국어원 문어 말뭉치 및 ㈜낱말 기본유의어 사전을 통해 검증한 결과, 본 제안 방법은 기존 방법에 비해 더 정확한 대체어를 추출한다. 또한 부적합한 대체어를 제외하는 모델로 사료될 수 있는 문법성 판단 모델보다 본 연구에서 제안한 대체 토큰 감지 모델의 대체어 추출 성능이 더 뛰어난 것을 확인하였다.
Files in This Item
Go to Link
Appears in
Collections
College of Information Technology > School of Software > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Lee, Soo won photo

Lee, Soo won
College of Information Technology (School of Software)
Read more

Altmetrics

Total Views & Downloads

BROWSE