Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

작성자 분석과 CNN을 적용한 소스 코드작성자 식별 프레임워크The Identification Framework for source code author using Authorship Analysis and CNN

Other Titles
The Identification Framework for source code author using Authorship Analysis and CNN
Authors
신건윤김동욱홍성삼한명묵
Issue Date
2018
Publisher
한국인터넷정보학회
Keywords
작성자 식별; 작석자 분석; 합성곱 신경망; 기계학습; 코드 분석; Author Identification; Authorship Analysis; Convolutional Neural Network; Machine Learning; Code Analysis
Citation
인터넷정보학회논문지, v.19, no.5, pp.33 - 41
Journal Title
인터넷정보학회논문지
Volume
19
Number
5
Start Page
33
End Page
41
URI
https://scholarworks.bwise.kr/gachon/handle/2020.sw.gachon/4674
DOI
10.7472/jksii.2018.19.5.33
ISSN
1598-0170
Abstract
최근 인터넷 기술이 발전함에 따라 다양한 프로그램들이 만들어지고 있고 이에 따라 다양한 코드들이 많은 사람들을 통해 만들어진다. 이러한 측면을 이용하여 특정 작성자가 작성한 코드들 그대로 가져가 자신이 작성한 것처럼 보여주거나, 참고한 코드들에 대한정확한 표기 없이 그대로 사용하여 이에 대한 보호가 점차 어려워지고 있다. 따라서 본 논문에서는 작성자 분석 이론과 합성곱 신경망 기반 자연어 처리 방법을 적용한 작성자 식별 프레임워크룰 제안한다. 작성자 분석 이론을 적용하여 소스 코드에서 작성자 식별에 적합한 특징들을 추출하고 이를 텍스트 마이닝에서 사용하고 있는 특징들과 결합하여 기계학습 기반의 작성자 식별을 수행한다. 그리고 합성곱 신경망 기반 자연어 처리 방법을 소스 코드에 적용하여 코드 작성자 분류를 수행한다. 본 논문에서는 작성자 분석이론과 합성곱 신경망을 적용한 작성자 식별 프레임워크를 통해 작성자를 식별하기 위해서는 작성자 식별만을 위한 특징들이 필요하다는 것과 합성곱 신경망 기반 자연어 처리 방법이 소스 코드등과 같은 특수한 체계를 갖추고 있는 언어에서도 적용이 가능하다. 실험 결과 작성자 분석 이론 기반 작성자 식별 정확도는 95.1%였으며 CNN을 적용한 결과 반복횟수가 90번 이상일 경우 98% 이상의정확도를 보여줬다.
Files in This Item
There are no files associated with this item.
Appears in
Collections
IT융합대학 > 소프트웨어학과 > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Han, Myung Mook photo

Han, Myung Mook
IT (Department of Software)
Read more

Altmetrics

Total Views & Downloads

BROWSE