논문 데이터베이스를 위한 텍스트 기반 유사도 계산 방안A Text-based Similarity Measure for Scientific Literature
- Other Titles
- A Text-based Similarity Measure for Scientific Literature
- Authors
- 윤석호; 김상욱
- Issue Date
- Oct-2011
- Publisher
- 한국정보처리학회
- Keywords
- Text-based Similarity Measure; Keyword-extension; Scientific Literature; 텍스트 기반 유사도; 키워드 확장; 논문 데이터베이스
- Citation
- 정보처리학회논문지D, v.18, no.5, pp 317 - 322
- Pages
- 6
- Indexed
- KCI
- Journal Title
- 정보처리학회논문지D
- Volume
- 18
- Number
- 5
- Start Page
- 317
- End Page
- 322
- URI
- https://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/167418
- DOI
- 10.3745/KIPSTD.2011.18D.5.317
- ISSN
- 1598-2866
- Abstract
- 본 논문에서는 기존 텍스트 기반 유사도 계산 방안을 이용해서 논문들 간의 유사도를 계산하는 방안에 대해서 논의한다. 먼저, 실험을 통해서 논문의 제목, 요약, 그리고 본문 중에서 어떤 부분이 유사도를 계산하는데 더 유용한지 확인하고 적절한 가중치를 부여한다. 두 번째로 논문의 텍스트 정보가 불완전한 상황에서 논문들 간의 유사도를 보다 정확하게 계산할 수 있는 키워드 확장 방안을 제안한다. 실제 논문 데이터베이스를 이용해서 제안하는 방안의 우수성을 검증한다.
This paper addresses computing of similarity among papers using text-based measures. First, we analyze the accuracy of the similarities computed using different parts of a paper, and propose a method of Keyword-Extension, which is very useful when text information is incomplete. Via a series of experiments, we verify the effectiveness of Keyword-Extension
- Files in This Item
-
Go to Link
- Appears in
Collections - 서울 공과대학 > 서울 컴퓨터소프트웨어학부 > 1. Journal Articles

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.