트리 기반 컨볼루션 신경망을 이용한 BigCloneBench 개선Improvement of BigCloneBench Using Tree-Based Convolutional Neural Network
- Other Titles
- Improvement of BigCloneBench Using Tree-Based Convolutional Neural Network
- Authors
- 박건우; 홍성문; 김현하; 도경구
- Issue Date
- Jun-2019
- Publisher
- 한국소프트웨어감정평가학회
- Keywords
- code clone; clone checking; machine learning; benchmark; Convolutional Neural Network; 코드 클론; 클론 검사; 기계 학습; 벤치마크; 합성곱 신경망
- Citation
- Journal of Software Assessment and Valuation, v.15, no.1, pp 43 - 53
- Pages
- 11
- Indexed
- KCICANDI
- Journal Title
- Journal of Software Assessment and Valuation
- Volume
- 15
- Number
- 1
- Start Page
- 43
- End Page
- 53
- URI
- https://scholarworks.bwise.kr/erica/handle/2021.sw.erica/4093
- DOI
- 10.29056/jsav.2019.06.05
- ISSN
- 2092-8114
2733-4384
- Abstract
- 기계 학습을 이용하여 의미가 유사한 코드 클론을 탐지하는 도구의 성능 평가에 빅클론벤치를 많이 활용한다. 하지만 빅클론벤치는 기계 학습에 최적화된 벤치마크가 아니기 때문에 그대로 기계 학습에 사용하면 잘못된 학습 데이터가 만들어질 수 있다. 본 연구에서는 빅클론벤치에서 제공하고 있는 코드 클론 데이터에서 누락된 타입-4 클론을 기계 학습을 이용하여 추가로 찾아 보완함으로써 빅클론벤치를 개선할 수 있음을 실험적으로 밝힌다. 트리 기반 컨볼루션 신경망을 이용한 기계 학습 모델을 사용해서 개선된 데이터를 학습했을 때, 기존의 데이터를 학습했을 때에 비해 기계 학습의 정확도 및 성능이 향상되었음을 확인하였다.
BigCloneBench has recently been used for performance evaluation of code clone detection tool using machine learning. However, since BigCloneBench is not a benchmark that is optimized for machine learning, incorrect learning data can be created. In this paper, we have shown through experiments using machine learning that the set of Type-4 clone methods provided by BigCloneBench can additionally be found. Experimental results using Tree-Based Convolutional Neural Network show that our proposed method is effective in improving BigCloneBench’s dataset.
- Files in This Item
-
Go to Link
- Appears in
Collections - COLLEGE OF COMPUTING > SCHOOL OF COMPUTER SCIENCE > 1. Journal Articles

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.