히스토그램 매칭 방식을 이용한 효율적인 전자문서 유사도 분석 방안에 관한 연구
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 김영식 | - |
dc.contributor.author | 백종경 | - |
dc.contributor.author | 박재표 | - |
dc.date.accessioned | 2022-12-02T07:40:02Z | - |
dc.date.available | 2022-12-02T07:40:02Z | - |
dc.date.created | 2022-12-02 | - |
dc.date.issued | 2022-08 | - |
dc.identifier.issn | 1975-4701 | - |
dc.identifier.uri | http://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/42736 | - |
dc.description.abstract | 지식재산권의 보호가 중요시하게 여겨지는 현대 사회에서 전자문서 유사도 분석은 필수이지만, 여러 상용 소프트웨어는 전자문서 유사도 분석을 인위적으로 회피하면 검출률이 매우 낮아진다. 본 논문에서는 상용 소프트웨어의 기존 분석 방법을 개선하기 위해서 컴퓨터 비전을 활용해 전자문서를 분석한다. 제안 시스템은 전자문서를 문장 단위로 구분하고, 각 문장을 바이너리 이미지로 인식하며, 이렇게 만들어진 이미지를 히스토그램으로 비교 분석할 수 있다. 시료는 총 세 가지 유형으로 분류하였으며, 전자문서 971개 안에 문장 37,960개를 비교 데이터로 활용한다. 세 가지 유형은 어절의 순서만 변형한 유형, 단어의 뜻은 같으나 음절 단위로 단어를 변형한 유형, 비슷한 의미의 단어로 대체한 유형으로 분류한다. 전체적인 평균 수치를 분석하면 제안 시스템을 활용하여 유사도 검사를 했을 때 검출률이 상용 소프트웨어보다 18.3 % 높은 수치를 보였다. 제안 시스템은 추후 전자문서 유사도 분석뿐만 아니라 전자문서의 색인화 및 분류, 서식 인식 등 전자문서가 활용되는 모든 분야에서 활용할 수 있다. | - |
dc.language | 한국어 | - |
dc.language.iso | ko | - |
dc.publisher | 한국산학기술학회 | - |
dc.relation.isPartOf | 한국산학기술학회논문지 | - |
dc.title | 히스토그램 매칭 방식을 이용한 효율적인 전자문서 유사도 분석 방안에 관한 연구 | - |
dc.title.alternative | A Study on the Efficient Electronic Document Similarity Analysis using Histogram Matching Method | - |
dc.type | Article | - |
dc.identifier.doi | 10.5762/KAIS.2022.23.8.664 | - |
dc.type.rims | ART | - |
dc.identifier.bibliographicCitation | 한국산학기술학회논문지, v.23, no.8, pp.664 - 672 | - |
dc.identifier.kciid | ART002869380 | - |
dc.description.journalClass | 2 | - |
dc.citation.endPage | 672 | - |
dc.citation.number | 8 | - |
dc.citation.startPage | 664 | - |
dc.citation.title | 한국산학기술학회논문지 | - |
dc.citation.volume | 23 | - |
dc.contributor.affiliatedAuthor | 박재표 | - |
dc.identifier.url | https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE11120400 | - |
dc.description.isOpenAccess | Y | - |
dc.subject.keywordAuthor | Histogram Matching | - |
dc.subject.keywordAuthor | Binary Imaging | - |
dc.subject.keywordAuthor | Similarity Analysis | - |
dc.subject.keywordAuthor | Documents Plagiarism | - |
dc.subject.keywordAuthor | Paraphrasing | - |
dc.description.journalRegisteredClass | kci | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
Soongsil University Library 369 Sangdo-Ro, Dongjak-Gu, Seoul, Korea (06978)02-820-0733
COPYRIGHT ⓒ SOONGSIL UNIVERSITY, ALL RIGHTS RESERVED.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.