Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

벨론 레퍼런스 코퍼스를 기준으로 exEyes의 재현율 평가Assessment of exEyes' Recall using Bellon Reference Corpus as a Benchmark

Other Titles
Assessment of exEyes' Recall using Bellon Reference Corpus as a Benchmark
Authors
최성하도경구
Issue Date
Sep-2015
Publisher
한국소프트웨어감정평가학회
Keywords
소프트웨어감정; 표절탐지; 코드클론; 재현율; software evaluation; piracy detect; code clone; reproduce rate
Citation
Journal of Software Assessment and Valuation, v.11, no.1, pp 31 - 39
Pages
9
Indexed
KCI
Journal Title
Journal of Software Assessment and Valuation
Volume
11
Number
1
Start Page
31
End Page
39
URI
https://scholarworks.bwise.kr/erica/handle/2021.sw.erica/17037
ISSN
2092-8114
2733-4384
Abstract
소프트웨어는 개발자의 전문적인 기술과 경험이 들어가 만들기 때문에 개발자에게 저작권이 주어진다. 한국저작권위원회에서는 소스코드 유사도 탐지도구인 exEyes로 소프트웨어의 표절 여부를 감정한다. 이 논문에서는코드 클론 탐지 프로그램의 성능평가 벤치마크인 벨론 레퍼런스 코퍼스를 기준으로 exEyes의 재현율을 평가한다. 벨론 레퍼런스 코퍼스에서 4개의 오픈소스(C언어 기반 : cook, weltab, Java 기반 : eclipse-ant, netbeans-javadoc, 10,055개 클론)를 선택하여 클론 타입 별 재현율을 측정한다. 그 결과 클론 타입 1은 100%, 타입 2는 63%, 타입 3은 34% 재현하는 것으로 나타났다. exEyes의 미탐 원인은 토큰의 의미를 고려하지 않고토큰의 유사성을 판정하고, 줄 단위로 비교를 함으로써 줄 바꿈 및 문장의 추가/삭제/변경에 적절히 대응하지못하기 때문으로 나타났다.
Copyrights for software source codes are given to developers. Korea Copyright Commission utilizes a clone-detection tool, exEyes, to find code clones that can be used to assess software plagiarism. This paper evaluates the recall of exEyes using Bellon Reference Corpus as a benchmark. Four open sources(cook and weltab in C, eclipse-ant and netbean-javadoc in Java) in Bellon Reference Corpus are selected as the benchmark. Among 10,055 clones in the corpus, exEyes' recall rate is 100% in clone type 1, 63% in clone type 2, and 34% in cone type 3. False negatives turn out to be mainly caused by ignoring the meaning of tokens when the comparison is made, and by setting the comparison be made line-by-line.
Files in This Item
Go to Link
Appears in
Collections
COLLEGE OF COMPUTING > SCHOOL OF COMPUTER SCIENCE > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Altmetrics

Total Views & Downloads

BROWSE