― 자료를 수집하고 분석하는 학문인 통계학에서 추정(estimation)의 중요성은 매우 크다 고 볼 수 있다. 추정을 통해 자료의 분포를 예측할 수 있고, 그 정확성을 높일 수가 있다. 즉, 자료 분포의 특성을 가장 잘 나타내어주는 “확률밀도함수”에 대한 추정 및 그 자 료들의 “평균 및 분산”에 대한 추정 등을 통하여 original data의 분석이 용이해지며, 더 나아가 더 방대한 자료에 대한 예측도 가능하게 된다.
앞으로 다루고자 하는 내용은 바로 이러한 추정에 대한 것이며, 이를 모수추정과 비모수 추정으로 구분하여 두 가지 방법의 개념과 차이점에 대해 알아보고자 한다.
Ⅱ. 모수추정 (Parametric Estimation)
(1) 모수추정의 개념
― 모수(parameter)에는 자료 집단()의 특성을 나타내주는 mean value()와 deviation value() 등이 있다. 이 값들을 주어진 자료 집단으로 알 수 있는 정보로 표현해 주는 것이 바로 모수추정이다. 모수추정의 두 가지 방법인 ‘Maximum Likelihood Estimation'과 ’Bayesian Estimation'에 대해 알아본다.
(2) Maximum Likelihood Estimation (MLE)
― 가 주어질 때 이 Likelihood 함수를 Maxmize 하는 (즉, 에서 가 어떤 값을 가져야 관측된 값들 X1, ... , Xn 이 나올 가능성이 가장 큰가) 값을 에 대한 Point estimate 로 사용하겠다는 것이다. 따라서, 가 되며, 보통의 경우 를 Maxmize 하는 것보다 계산이 쉬운 를 Maximize하는 값을 찾는다.
― Ex) The Gaussian Case : unknown (=) and (=)
....