Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

효과적인 중복 포스트 검출 기법An Effective Approach for Detecting Duplicate Posts

Other Titles
An Effective Approach for Detecting Duplicate Posts
Authors
이상철이순행박희진김상욱
Issue Date
Feb-2011
Publisher
한국정보과학회
Keywords
blog; indexing; string matching; web search engines; 블로그; 인덱싱; 스트링 매칭; 웹 검색 엔진
Citation
정보과학회 컴퓨팅의 실제 논문지, v.17, no.2, pp.83 - 88
Indexed
KCI
Journal Title
정보과학회 컴퓨팅의 실제 논문지
Volume
17
Number
2
Start Page
83
End Page
88
URI
https://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/169030
ISSN
2383-6318
Abstract
최근, 블로그 사용이 활성화됨에 따라 중복포스트가 다량 생성되고 있다. 이 중복포스트들은 블로그 검색 성능 및 품질을 저하시킬 뿐만 아니라 원본 포스트와의 저작권의 문제를 발생시키기 때문에 이를 검출하고 필터링하는 것이 웹 검색 엔진에서 중요한 문제이다. 본 논문은 대용량 블로그 데이터베이스 환경에 적합한 중복포스트 검출 기법을 제안한다. 또한 이를 이용하여 블로그 포스트 검색 인덱스에 반영하지 않는 방안을 제안한다. 다양한 실험을 통하여 제안하는 기법의 우수성을 검증한다.
Files in This Item
Go to Link
Appears in
Collections
서울 공과대학 > 서울 컴퓨터소프트웨어학부 > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Park, Hee jin photo

Park, Hee jin
COLLEGE OF ENGINEERING (SCHOOL OF COMPUTER SCIENCE)
Read more

Altmetrics

Total Views & Downloads

BROWSE