빅 데이터와 기계 학습의 시대 심리학 연구 모형의 평가 원칙과 방법

이태헌

doi:10.22257/kjp.2021.12.40.4.389

Detailed Information

Cited 0 time in webofscience

Cited 0 time in scopus

Metadata Downloads

빅 데이터와 기계 학습의 시대 심리학 연구 모형의 평가 원칙과 방법Principles and methods for model assessment in psychological research in the era of big-data and machine learning

Authors: 이태헌

Issue Date: Dec-2021

Publisher: 한국심리학회

Keywords: overfitting; generalization error; training error; cross-validation; bias-variance tradeoff; 과적합; 일반화 오차; 훈련 오차; 교차-타당성 입증법; 편향-분산 균형

Citation: 한국심리학회지:일반, v.40, no.4, pp 389 - 413

Pages: 25

Journal Title: 한국심리학회지:일반

Volume: 40

Number: 4

Start Page: 389

End Page: 413

URI: https://scholarworks.bwise.kr/cau/handle/2019.sw.cau/52813

DOI: 10.22257/kjp.2021.12.40.4.389

ISSN: 1229-067X

Abstract: 본 논문에서는 계량 심리학 분야에서 지난 수 십 년 동안 꾸준히 논의가 진행되어 왔던 모형 추정과 평가의 원칙을 심리학 연구자들에게 소개하는 것을 목적으로 한다. 계량 심리학 분야에서 진행된 논의의 핵심은 1) 후보 모형들은 참 모형(true model)이 아니라 근사 모형(approximating model)이며, 2) 데이터 크기가 무한히 커지더라도 참 모형과 근사 모형 간 불일치는 사라지는 것은 아니기 때문에, 3) 여러 후보 모형 중 참 모형과의 불일치가 가장 낮은 것으로 추정되는 근사 모형을 선정하는 것이 바람직하다는 것이다. 이러한 모형 선정의 원리는 4차 산업 혁명의 시대, 여러 학문 분야에 걸쳐 그 영역을 확장하고 있는 기계 학습(machine learning) 분야에서 채택하고 있는 모형 평가의 원칙과 동일함을 설명하였다. 즉, 기계 학습 분야에서는 훈련(training) 과정에 노출되지 않았던 새로운 사례에서 보이는 모형의 성능인 일반화 혹은 예측 오차(generalization or prediction error)를 추정함으로써 모형을 선정하는데, 이는 계량 심리학 분야에서 근사모형과 참모형의 불일치 추정량인 총체적 오차(overall discrepancy)를 추정함으로써 모형을 선정해야 한다는 원리와 동일함을 설명하였다. 본 논문의 두 번째 목적은, 이러한 모형 선정의 원칙에 대한 이해를 바탕으로, 현재 심리학 분야에서 주어진 데이터에 대한 “철저한” 분석 관행이 초래하는 과적합(overfitting) 문제와 그 해결 방안을 논의하는 데 있다. 특히, 기계 학습 분야에서 가정 널리 사용되고 있으며, 계량 심리학 분야에서도 오래전부터 논의가 되어온(Mosier, 1951) 교차-타당성 입증법(cross-validation)을 일반화 오차의 추정량이라는 관점에서 소개하고 사용을 당부하였다.

Files in This Item

빅 데이터와 기계 학습의 시대 심리학 연구 모형의 평가 원칙과 방법.pdf 370.89 kB

Appears in Collections: College of Social Sciences > Department of Psychology > 1. Journal Articles

Show full item record

qrcode

Altmetrics

Total Views & Downloads

STATISTICS: Total View :7,042,572; Today View :580

RSS_1.0 RSS_2.0 ATOM_1.0

84, Heukseok-ro, Dongjak-gu, Seoul, Republic of Korea (06974)02-820-6194

Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.

Detailed Information

Altmetrics

Total Views & Downloads

BROWSE