다중회귀분석
다중회귀분석의 기본개념
등장배경
회귀라는 용어는 영국의 생물학자이며 통계학자인 F. Galton(1822-1911)이 C. Darwin(1809-1882)의 진화론을 반증하기 위하여 처음으로 사용
K. Pearson(1857-1936)은 Galton의 이러한 연구를 뒷받침하기 위하여 1,078가족의 부자간의 신장자료를 이용하여 아버지의 키(X)와 아들의 키(Y)에 대하여 다음과 같은 일차 함수관계식을 구함
Y=33.73+5.16X (inch)
현실세계에서는 설명변수 하나만으로는
⑴설명력이 부족
⑵유의한 설명변수 간 영향력 비교가 요구
다중회귀분석 등장
다중회귀분석의 목적
⑴ 여러 개의 독립변수로 종속변수를 설명하는 모형을 만들 수 있음
⑵ 모형의 적합성, 각 회귀계수의 크기, 결정계수의 크기 검정할 수 있음
⑶ 여러 개의 독립변수 중에서 유의한 변수만 선택하여 유의한 모형을 만들 수 있음
⑷ 독립변수들이 종속변수에 미치는 영향의 정도를 비교할 수 있음
추정 및 검정
회귀계수의 추정
오차항의 제곱합 Q는
최소자승법(OLS;Ordinary Least Squares)에 의한 회귀계수의 추정은 제곱합 Q를 각 에 대하여 편미분하고 이를 0으로 하는 다음과 같은 연립방정식을 풀어 들을 구하는 것
추정 및 검정
앞의 연립방정식을 만족하는 ß를 ß 라 하면 다음 관계가 성립하는데 이는 정규방정식임
따라서 베타의 최소자승추정량은 다음과 같다
모형에 대한 추론
....
다중회귀분석 회귀방정식은 각각의 독립변수와 종속 변수간의 관계의 정도(강도)와 관계의 방향을 알 수 있다.
다중회귀 분석에서는 독립변수가 여러 개이므로 독립변수들 간의 상호관계를 점검해야 하는 것이 선행되어야 한다...