기계학습을 활용한 SW 융합 R&D 자동 분류 및 현황 분석에 관한 연구
- Authors
- 김영민; 서영희; 김명호
- Issue Date
- Jun-2019
- Publisher
- 기술경영경제학회
- Citation
- 기술경영경제학회 하계학술대회, pp.1 - 19
- Indexed
- OTHER
- Journal Title
- 기술경영경제학회 하계학술대회
- Start Page
- 1
- End Page
- 19
- URI
- https://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/186391
- Abstract
- 4차 산업혁명에 대응하기 위해서는 타 산업의 경쟁력 확보를 위해 SW을 융합한 연구개발(이하 R&D)에 대한 전략 마련이 필요하다. 현재 정부 부처 및 분야별로 SW 융합 R&D가 추진되고 있으나, 현황을 파악할 정량적인 방법이 없기 때문에 SW R&D 전문가가 방대한 시간과 비용을 투입하여 수행하는 정성적 방법론인 델파이 방식으로 과제를 판단하였다. 이를 극복하고자 본 연구에서는 NTIS에서 제공하는 R&D 과제의 제목과 요약문, 기대효과 등에 대해 텍스트 분석과 기계학습을 활용하여 자동으로 SW 융합 R&D 여부를 판단하는 모델을 개발하여 현황 파악을 수행하고자 한다.
본 연구에서는 SW 융합 R&D의 단계를 총 다섯 가지(High, Med High, Medium, Med Low, Low)로 구분하여 각 R&D 과제마다 이 중 하나의 단계를 할당하였다. 추후 분류 모델 구축을 통해 과제별로 SW 융합 R&D 단계를 예측한다. 분석에 활용한 데이터는 2016년에 수행한 국가 R&D 과제 중 층화추출 방식을 활용하여 뽑은 2,000개의 과제 정보와 추가로 확보한 814건의 데이터를 사용하였으며 반복 무작위 부표본 검증을 사용하여 예측 결과를 검증하였다.
본 연구의 결과는 다음과 같다. 첫째, 주어진 데이터를 활용하였을 때, 세 가지 분류 방법론 중 평균적으로 SVM(Support Vector Machine)이 가장 예측력이 높았다. 둘째, 다섯 가지 SW 융합 R&D 단계 분류에 대한 10회 실행에서의 평균 예측력은 89.07%로 측정되었다. 셋째, 본 연구를 통해 국가연구개발사업의 모든 과제를 대상으로 기계 학습 모델에 의한 자동 분류를 수행하여 비용 및 시간을 절약하고 SW 융합 R&D에 대한 전반적인 현황을 파악할 수 있다. 이러한 현황 데이터를 기반으로 혁신 성장 동력 확보를 위한 SW 융합 R&D 정책 수립이 가능할 것이다. 향후 다양한 텍스트 분류 알고리즘 검증 및 분류 결과에 대한 검증을 통해 모델을 보완한다면 더 일반화되고 예측력이 높은 연구 결과를 얻을 것으로 기대한다.
- Files in This Item
-
Go to Link
- Appears in
Collections - 서울 기술경영전문대학원 > 서울 기술경영학과 > 1. Journal Articles

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.