기계학습을 이용한 한국어 대화시스템 도메인 분류Machine Learning Based Domain Classification for Korean Dialog System
- Other Titles
- Machine Learning Based Domain Classification for Korean Dialog System
- Authors
- 정영섭
- Issue Date
- 2019
- Publisher
- 중소기업융합학회
- Keywords
- 한국어 대화시스템; 자연어이해; 도메인 분류; 기계학습; 랜덤 포레스트; Korean dialog system; Natural language understanding; Domain classification; Machine learning; Random forest
- Citation
- 융합정보논문지, v.9, no.8, pp.1 - 8
- Journal Title
- 융합정보논문지
- Volume
- 9
- Number
- 8
- Start Page
- 1
- End Page
- 8
- URI
- https://scholarworks.bwise.kr/sch/handle/2021.sw.sch/5056
- DOI
- 10.22156/CS4SMB.2019.9.8.001
- Abstract
- 대화시스템은 인간과 컴퓨터의 상호작용에 새로운 패러다임이 되고 있다. 자연어로써 상호작용함으로써 인간은 보다 자연스럽고 편리하게 각종 서비스를 누릴 수 있게 되었다. 대화시스템의 구조는 일반적으로 음성 인식, 자연어 이해, 문맥 파악 등의 여러 모듈의 파이프라인으로 이뤄지는데, 본 연구에서는 자연어 이해 모듈의 도메인 분류 문제를 풀기 위해 convolutional neural network, random forest 등의 기계학습 모델을 비교하였다. 사람이 직접 태깅한 총 7개 서비스 도메인 데이터에 대하여 각 문장의 도메인을 분류하는 실험을 수행하였고 random forest 모델이 F1 score 0.97 이상으로 가장 높은 성능을 달성한 것을 보였다. 향후 다른 기계학습 모델들을 추가 실험함으로써 도메인 분류 성능 개선을 지속할 계획이다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - SCH Media Labs > Department of Big Data Engineering > 1. Journal Articles
![qrcode](https://api.qrserver.com/v1/create-qr-code/?size=55x55&data=https://scholarworks.bwise.kr/sch/handle/2021.sw.sch/5056)
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.