선형회귀모형 (Linear Regression Model) 의 정의
(선형)회귀분석은 통계학에서 인과형 예측기법중에 하나이다.
인과형 예측기법은 수학적으로 인과관계를 나타내는 인과 모델을 만들어 수요를 예측하는
방법을 말한다. 즉 수요에 영향을 주는 환경요인들을 파악하고 수요와 이 요인들간의
관계를 파악함으로써 미래의 수요량을 예측하는 기법이다.
좀 어렵게 말했는데.. 간단하게 말하면 교육이라는 수요에 영향을 미치는 요인중에서
재산의 크기에 따라 교육의 수요가 얼마나 변하는 지를 수학적 함수로 측정하는 것을
말한다. 여기서 재산을 변수 X 라고 하고 교육의 수요를 변수 Y 라고 했을 때
X와 Y의 두 변수간의 상관관계를 정의하는데 이 상관관계가 선형(Lenear) 의 형태를
나타내는 것을 선형회귀모형이라고 한다.
보통 X 를 독립변수 , Y를 종속변수 라고 지칭을 하는데.. X 라는 독립된 값이 주어지면
이 X값에 종속되어 결정되어지는 변수가 바로 Y 인 것이다.
위 예에서는 재산이 X 독립변수이고 교육의 수요가 Y 종속변수가 된다고 할 수 있다.
X 독립변수가 1개이면 단일선형회귀모형이고 n개 이상이면 다중선형회귀모형 이다.
Y = a + bX

선형회귀모형의 가정
이러한 선형회귀모형이 성립되려면 몇가지 가정이 전제되어야 한다.
① 무작위성 (Randomness) 또는 독립성
- 독립변수 간의 상관관계가 없어야 한다.
- 다중선형회귀분석에서 독립변수 X 들간의 어떤 상관관계가 있으면 안된다는 뜻.
② 정규성 (Normality)
- 모든 회계계수가 통계적으로 유의한지를 검증을 해야 한다.
- 서로 독립적이며 평균이 0 , 분산이 정규분포를 따라야 한다.
③ 등분산성
- 편차의 분산이 특정한 패턴을 이루면 안된다. 즉 고르게 분포해야 함.
아래 그림을 보면 y값이 증가함에 따라 편차가 따라서 커지는 패턴을 보이는데
이러면 등분산성을 만족하지 못함

④ 선형성
- 종속변수와 독립변수간의 선형성을 만족해야 함.
'소프트웨어공학' 카테고리의 다른 글
CMMI (Capability Maturity Model Integration) (2/3) (0) | 2019.11.11 |
---|---|
CMMI (Capability Maturity Model Integration) (1/3) (0) | 2019.11.10 |
함수 종속에 대한 추론규칙 (암스트롱의 공리) (0) | 2019.10.30 |
정보시스템 감리기준 (행정안전부 고시 제2017-1호) (0) | 2019.10.28 |
소프트웨어 개발 방법론 (3/3) (0) | 2019.10.24 |