대체 토큰 감지 모델을 통한 대체어 추출Lexical Substitution Using a Replaced Token Detection Model
- Other Titles
- Lexical Substitution Using a Replaced Token Detection Model
- Authors
- 지승현; 이수원
- Issue Date
- Apr-2023
- Publisher
- 한국정보과학회
- Keywords
- 대체어 추출; 대체어; 언어 모델; lexical substitution; alternative word; language model
- Citation
- 정보과학회논문지, v.50, no.4, pp.321 - 328
- Journal Title
- 정보과학회논문지
- Volume
- 50
- Number
- 4
- Start Page
- 321
- End Page
- 328
- URI
- http://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/43782
- DOI
- 10.5626/JOK.2023.50.4.321
- ISSN
- 2383-630X
- Abstract
- 대체어란 한 문장에서 특정 단어를 대신하여 사용해도 문장의 의미를 훼손하지 않는 단어이며, 이를 추출하는 기술은 데이터 증강 등 다양한 자연어처리 문제에 활용할 수 있다. 기존 대체어 추출 방법은 문맥에 부자연스러운 대체어를 추출할 수 있다는 문제가 있다. 이를 해결하기 위해 본 논문에서는 말뭉치에서 목표 단어가 포함된 문장을 샘플링하여 사전학습 BERT 기반 대체어 후보 생성 모델에 입력하고, 대체 토큰 감지 모델로 부적합한 대체어를 제외하여 대체어를 추출하는 방법을 제안한다. 국립국어원 문어 말뭉치 및 ㈜낱말 기본유의어 사전을 통해 검증한 결과, 본 제안 방법은 기존 방법에 비해 더 정확한 대체어를 추출한다. 또한 부적합한 대체어를 제외하는 모델로 사료될 수 있는 문법성 판단 모델보다 본 연구에서 제안한 대체 토큰 감지 모델의 대체어 추출 성능이 더 뛰어난 것을 확인하였다.
- Files in This Item
-
Go to Link
- Appears in
Collections - College of Information Technology > School of Software > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.