머신러닝 기반 안드로이드 모바일 악성 앱의최적 특징점 선정 및 모델링 방안 제안Modeling and Selecting Optimal Features for Machine Learning Based Detections of Android Malwares
- Other Titles
- Modeling and Selecting Optimal Features for Machine Learning Based Detections of Android Malwares
- Authors
- 이계웅; 오승택; 윤영
- Issue Date
- 2019
- Publisher
- 한국정보처리학회
- Keywords
- 안드로이드; 악성코드; APK; 인공지능; 앙상블 알고리즘; Android; Malware; APK; AI; Ensemble Algorithm
- Citation
- 정보처리학회논문지. 소프트웨어 및 데이터 공학, v.8, no.11, pp.427 - 432
- Journal Title
- 정보처리학회논문지. 소프트웨어 및 데이터 공학
- Volume
- 8
- Number
- 11
- Start Page
- 427
- End Page
- 432
- URI
- https://scholarworks.bwise.kr/hongik/handle/2020.sw.hongik/2226
- ISSN
- 2287-5905
- Abstract
- 모바일 운영체제 중 안드로이드의 점유율이 높아지면서 모바일 악성코드 위협은 대부분 안드로이드에서 발생하고 있다. 그러나 정상앱이나 악성앱이 진화하면서 권한 등의 단일 특징점으로 악성여부를 연구하는 방법은 유효성 문제가 발생하여 다양한 특징점 추출 및 기계학습을 통해 이를 극복하고자 한다. 본 논문에서는 APK 파일에서 구동에 필요한 다섯 종류의 특징점들을 안드로가드라는 정적분석 툴을 사용하여 학습데이터의 특성을 추출한다. 또한 추출된 중요 특징점을 기반으로 모델링을 하는 세 가지 방법을 제시한다. 첫 번째 방법은 보안 전문가에 의해 엄선된 132가지의 특징점 조합을 바탕으로 모델링하는 것이다. 두 번째는 학습 데이터 7,000개의 앱에서 발생 빈도수가 높은 상위 99%인 8,004가지의 특징점들 중 랜덤포레스트 분류기를 이용하여 특성중요도가 가장 높은 300가지를 선정 후 모델링 하는 방법이다. 마지막 방법은 300가지의 특징점을 학습한 다수의 모델을 통합하여 하나의 가중치 투표 모델을 구성하는 방법이다. 추가적으로 오탐률 및 미탐률을 개선하기 위해 권한 정보를 모두 제외하여 특징점을 재구성하고 위와 같은 환경으로 모델링하였다. 최종적으로 가중치 투표 모델인 앙상블 알고리즘 모델을 사용하여 97.8%로 정확도가 개선되었고 오탐률은 1.9%로 성능이 개선된 것이 확인되었다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - College of Engineering > Computer Engineering Major > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.