Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

약물유전체학에서 약물반응 예측모형과 변수선택 방법Feature selection and prediction modeling of drug responsiveness in Pharmacogenomics

Authors
김규환김원국
Issue Date
Apr-2021
Publisher
한국통계학회
Keywords
AUC; 앙상블; 머신러닝; 랜덤포레스트; 스태킹; AUC; ensemble method; machine learning; random forest; stacking
Citation
응용통계연구, v.34, no.2, pp 153 - 166
Pages
14
Journal Title
응용통계연구
Volume
34
Number
2
Start Page
153
End Page
166
URI
https://scholarworks.bwise.kr/cau/handle/2019.sw.cau/50966
DOI
10.5351/KJAS.2021.34.2.153
ISSN
1225-066X
2383-5818
Abstract
약물유전체학 연구의 주요 목표는 고차원의 유전 변수를 기반으로 개인의 약물 반응성을 예측하는 것이다. 변수의 개수가 많기 때문에 변수의 개수를 줄이기 위해서는 변수 선택이 필요하며, 선택된 변수들은 머신러닝 알고리즘을 사용하여 예측 모델을 구축하는데 사용된다. 본 연구에서는 400명의 뇌전증 환자의 차세대 염기서열 분석 데이터에 로지스틱 회귀, ReliefF, TurF, 랜덤 포레스트, LASSO의 조합과 같은 여러 가지 혼합 변수 선택 방법을 적용하였다. 선택된 변수들에 랜덤포레스트, 그래디언트 부스팅, 서포트벡터머신을 포함한 머신러닝 방법들을 적용했고 스태킹을 통해 앙상블 모형을 구축하였다. 본 연구의 결과는 랜덤포레스트와 ReliefF의 혼합 변수 선택 방법을 이용한 스태킹 모형이 다른 모형보다 더 좋은 성능을 보인다는 것을 보여주었다. 5-폴드 교차 검증을 기반으로 하여 적합한 최적 모형의 평균 검증 정확도는 0.727이고 평균 검증 AUC 값은 0.761로 나타났다. 또한, 동일한 변수를 사용할 때 스태킹 모델이 단일 머신러닝 예측 모델보다 성능이 우수한 것으로 나타났다.
Files in This Item
There are no files associated with this item.
Appears in
Collections
College of Business & Economics > Department of Applied Statistics > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Kim, Won Kuk photo

Kim, Won Kuk
경영경제대학 (응용통계학과)
Read more

Altmetrics

Total Views & Downloads

BROWSE