기계학습 기반 유튜브 악플 분석: “사이버렉카”에 달린 댓글의 어휘적 특성Machine Learning-Based Analysis of Malicious Comments on YouTube: Lexical Features of Comments on “Cyber Wrecker”
- Authors
- 이신행; 이주연; 조민정; 박태강
- Issue Date
- Jun-2022
- Publisher
- 한국디지털콘텐츠학회
- Keywords
- 악성 댓글; 유튜브 콘텐츠; 사이버렉카; 기계학습; 텍스트 마이닝; Malicious comments; YouTube contents; Cyber wrecker; Machine learning; Text mining
- Citation
- 디지털컨텐츠학회논문지, v.23, no.6, pp 1115 - 1122
- Pages
- 8
- Journal Title
- 디지털컨텐츠학회논문지
- Volume
- 23
- Number
- 6
- Start Page
- 1115
- End Page
- 1122
- URI
- https://scholarworks.bwise.kr/cau/handle/2019.sw.cau/61286
- DOI
- 10.9728/dcs.2022.23.6.1115
- ISSN
- 1598-2009
2287-738X
- Abstract
- 본 연구는 특정 유명인에 대한 선정적 유튜브 콘텐츠로 혐오를 조장하고 악성 댓글(이하 악플)을 확산시키는 일명 “사이버렉카” 채널에 주목해 여기에 달린 댓글을 수집한 후 기계학습 알고리즘으로 악플을 분류하여 그 어휘적 특성을 분석했다. 이를 위해 로지스틱 회귀 모델을 기계학습 알고리즘으로 사용하고 예측 성능을 높이기 위해 과적합을 방지하는 정규화 과정을 거쳤다. 그 결과, “사이버렉카” 콘텐츠는 욕설이나 비속어보다는 외모 비하나 조롱 목적의 멸칭과 모욕적 상징이 함축된 고유 명사가 사용되는 악플을 양산하고 있었고 이 과정에서 다양한 언어적 변이가 일어나고 있음을 발견했다. 이러한 결과를 바탕으로 기계학습의 방법을 이용한 악플 탐지의 가능성을 진단하고 그 한계를 극복하는 방안을 논의했다.
Considering the so-called “cyber wrecker,” which spreads hatred with sensational YouTube content about celebrities, this study collected comments posted on its channels, classified malicious comments with a machine learning algorithm, and analyzed their lexical characteristics. To this end, a logistic regression model was used as the algorithm and a regularization process was applied to improve prediction performance by preventing overfitting. As a result, we found that “cyber wrecker” content produced malicious comments using proper nouns, which connoted a derogatory or insulting meaning for mocking purposes, rather than swear words or slang. Also, various linguistic variations were found in the posting of malicious comments. Based on these results, we discussed the machine learning method for detecting malicious comments and ways to overcome its limitations.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - College of Social Sciences > School of Media & Communication > 1. Journal Articles
![qrcode](https://api.qrserver.com/v1/create-qr-code/?size=55x55&data=https://scholarworks.bwise.kr/cau/handle/2019.sw.cau/61286)
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.