공통 토큰에 기반한 서로 다른 언어의 유사성 검사
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 홍성문 | - |
dc.contributor.author | 김현하 | - |
dc.contributor.author | 이제형 | - |
dc.contributor.author | 박성우 | - |
dc.contributor.author | 모지환 | - |
dc.contributor.author | 도경구 | - |
dc.date.accessioned | 2021-06-22T12:40:51Z | - |
dc.date.available | 2021-06-22T12:40:51Z | - |
dc.date.issued | 2018-12 | - |
dc.identifier.issn | 2092-8114 | - |
dc.identifier.issn | 2733-4384 | - |
dc.identifier.uri | https://scholarworks.bwise.kr/erica/handle/2021.sw.erica/7278 | - |
dc.description.abstract | 서로 다른 언어로 작성된 소스코드의 유사성 검사는 주로 요약구문트리를 기반으로 비교를 수행한다. 하지만 대규모의 소스코드를 실용적인 수준으로 비교하려면 토큰수준 기반에서 작동하는 유사성 검사 기술이 필요하다. 본 연구에서는 서로 다른 언어에서 생성되었지만 같은 의미를 지닌 토큰을 표현할 수 있는 공통 토큰을 정의하고, 소스코드에서 언어별 처리 과정을 거쳐 생성한 공통 토큰의 나열을 입력으로 소스코드의 유사성 검사를 수행하는 방법을 제안한다. 한국저작권위원회의 표절검사 도구 exEyes를 사용해서 서로 다른 언어로 작성된 동일한 코드를 대상으로 실험한 결과, 제안한 방법을 사용했을 때, 유사성 평가 성능이 향상됨을 보였다. | - |
dc.description.abstract | Tools for detecting cross-language clones usually compare abstract-syntax-tree representations of source code, which lacks scalability. In order to compare large source code to a practical level, we need a similarity checking technique that works on a token level basis. In this paper, we define common tokens that represent all tokens commonly used in programming languages of different paradigms. Each source code of different language is then transformed into the list of common tokens that are compared. Experimental results using exEyes show that our proposed method using common tokens is effective in detecting cross-language clones. | - |
dc.format.extent | 10 | - |
dc.language | 한국어 | - |
dc.language.iso | KOR | - |
dc.publisher | 한국소프트웨어감정평가학회 | - |
dc.title | 공통 토큰에 기반한 서로 다른 언어의 유사성 검사 | - |
dc.title.alternative | Cross-Language Clone Detection based on Common Token | - |
dc.type | Article | - |
dc.publisher.location | 대한민국 | - |
dc.identifier.bibliographicCitation | Journal of Software Assessment and Valuation, v.14, no.2, pp 35 - 44 | - |
dc.citation.title | Journal of Software Assessment and Valuation | - |
dc.citation.volume | 14 | - |
dc.citation.number | 2 | - |
dc.citation.startPage | 35 | - |
dc.citation.endPage | 44 | - |
dc.identifier.kciid | ART002416967 | - |
dc.description.isOpenAccess | N | - |
dc.description.journalRegisteredClass | kciCandi | - |
dc.subject.keywordAuthor | 언어간 클론 탐지 | - |
dc.subject.keywordAuthor | 클론 검사 | - |
dc.subject.keywordAuthor | 코드 클론 | - |
dc.subject.keywordAuthor | 소스코드 표절 | - |
dc.subject.keywordAuthor | 공통 토큰 | - |
dc.subject.keywordAuthor | cross-language clone detection | - |
dc.subject.keywordAuthor | clone checking | - |
dc.subject.keywordAuthor | code clone | - |
dc.subject.keywordAuthor | common tokens | - |
dc.identifier.url | https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART00241696 | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
55 Hanyangdeahak-ro, Sangnok-gu, Ansan, Gyeonggi-do, 15588, Korea+82-31-400-4269 sweetbrain@hanyang.ac.kr
COPYRIGHT © 2021 HANYANG UNIVERSITY. ALL RIGHTS RESERVED.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.