태그 정보를 활용한 PG-Net 모델 기반 한국어 문서 생성 요약
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 서동국 | - |
dc.contributor.author | 김건우 | - |
dc.contributor.author | 이동호 | - |
dc.date.accessioned | 2021-06-22T09:23:26Z | - |
dc.date.available | 2021-06-22T09:23:26Z | - |
dc.date.issued | 2019-12 | - |
dc.identifier.uri | https://scholarworks.bwise.kr/erica/handle/2021.sw.erica/1945 | - |
dc.description.abstract | 기존 문서 요약 기법 중 생성 요약 방식에서는 사전에 없는 단어를 요약에 반영하지 못하는 OOV(Out-of-Vocabulary) 문제와 반복적인 단어와 어구들로 구성된 문장을 생성하는 문제가 존재한다. 이러한 문제들을 해결하기 위해 PG-Net(Pointer Generator Network) 모델이 제안되었지만 생성할 단어들을 문맥적으로 고려하지 않고 단어 별로 다음에 올 단어를 예측하여 문장을 구성하기 때문에 생성된 요약이 원문의 의미와 달라지는 문제점이 발생하였다. 본 논문에서는 형태소 분석과 개체명 인식 과정을 통해 단어의 품사 정보와 개체의 의미 정보를 동시에 학습함으로써 문서의 핵심 내용을 보다 잘 요약할 수 있는 태그 정보 기반의 PG-Net 모델을 제안한다. 또한 한 어절이 어근 및 접사로 구성되는 한국어의 특징을 반영하기 위해 형태소 및 개체명 단위의 임베딩 학습 방법론을 제시한다. 마지막으로 비교 실험을 통해 본 논문에서 제안하는 방법이 기존 방법들보다 우수함을 보인다. | - |
dc.format.extent | 3 | - |
dc.language | 한국어 | - |
dc.language.iso | KOR | - |
dc.publisher | 한국정보과학회 | - |
dc.title | 태그 정보를 활용한 PG-Net 모델 기반 한국어 문서 생성 요약 | - |
dc.title.alternative | Abstractive Document Summarization based on PG-Net using Tag Information | - |
dc.type | Article | - |
dc.publisher.location | 대한민국 | - |
dc.identifier.bibliographicCitation | 2019년 한국소프트웨어종합학술대회 논문집, pp 482 - 484 | - |
dc.citation.title | 2019년 한국소프트웨어종합학술대회 논문집 | - |
dc.citation.startPage | 482 | - |
dc.citation.endPage | 484 | - |
dc.description.isOpenAccess | N | - |
dc.description.journalRegisteredClass | other | - |
dc.identifier.url | https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE09301628 | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
55 Hanyangdeahak-ro, Sangnok-gu, Ansan, Gyeonggi-do, 15588, Korea+82-31-400-4269 sweetbrain@hanyang.ac.kr
COPYRIGHT © 2021 HANYANG UNIVERSITY. ALL RIGHTS RESERVED.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.