code2vec을 이용한 유사도 감정 도구의 성능 개선Enhancing the performance of code-clone detection tools using code2vec
- Other Titles
- Enhancing the performance of code-clone detection tools using code2vec
- Authors
- 엄태호; 홍성문; 양준혁; 장효석; 도경구
- Issue Date
- Jan-2021
- Publisher
- 한국소프트웨어감정평가학회
- Keywords
- program similarity; program plagiarism; machine learning; code clone; code comparison; 프로그램 유사도; 프로그램 표절; 머신 러닝; 코드클론; 코드 비교
- Citation
- Journal of Software Assessment and Valuation, v.17, no.1, pp.31 - 40
- Indexed
- KCI
- Journal Title
- Journal of Software Assessment and Valuation
- Volume
- 17
- Number
- 1
- Start Page
- 31
- End Page
- 40
- URI
- https://scholarworks.bwise.kr/erica/handle/2021.sw.erica/108333
- ISSN
- 2092-8114
- Abstract
- 소스코드 표절은 원본 자료의 출처를 분명히 밝히지 않고 자신의 것처럼 사용하는 행위를 말한다. 소스코드 표절로 인한 문제는 법적인 분쟁을 다투는 경우까지 다양한 문제를 일으킨다. 소스코드의 표절 여부는 일반적으로 비교 대상 소프트웨어 프로젝트 내의 각 소스코드를 전수 비교하여 유사도를 측정하여 결정한다.
전수 비교는 표절 가능성이 전혀 없는 코드도 비교 대상에 포함하기 때문에 그만큼의 시간을 헛되이 소모한다. 소스코드 표절로 의심되는 비교 쌍만 선별하여 비교할 수 있으면 그만큼 비교 횟수는 줄어들게 되어 탐지 도구의 실행 속도를 향상시킬 수 있을 뿐만 아니라, 표절 가능성이 높은 부분만을 대상으로 탐지의 정확도를 높이는데 집중할 수도 있다. 본 논문에서는 code2vec 이라는 기계학습 모델을 활용하여 코드 클론으로의심되는 소스코드들을 미리 분류하여 비교 횟수를 줄임으로써 소스코드 표절 탐지의 성능을 개선할 수 있음을 보인다.
- Files in This Item
-
Go to Link
- Appears in
Collections - COLLEGE OF COMPUTING > SCHOOL OF COMPUTER SCIENCE > 1. Journal Articles
![qrcode](https://api.qrserver.com/v1/create-qr-code/?size=55x55&data=https://scholarworks.bwise.kr/erica/handle/2021.sw.erica/108333)
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.