[통계] 표본 평균의 분포와 중심극한정리

2024. 1. 15. 17:39통계

1. 표본평균의 평균과 표준편차

 

$X_1,...,X_n$을 모평균 $\mu$, 모분산 $\sigma^2$인 모집단으로부터의 확률표본이라고 할 때, 이 확률표본으로부터의 표본평균 $\overline{X}= \sum_{i=1}^{n}X_i/n$을 생각해본다.

 

분포에 대한 성질을 알기 위해 표본평균의 기대값과 분산을 구해본다. 기대값의 가법성으로부터 표본평균의 기대값은

$$E(\overline{X})=\frac{1}{n}E(X_1+...+X_n)=\frac{1}{n}[(E(X_1)+...+E(X_n)]=\frac{1}{n}n\mu=\mu$$

이고, $\overline{X}$의 분산은 $X_1,...,X_n$이 서로 독립이므로 분산의 가법성을 이용하여

$$Var(\overline{X})=\frac{1}{n^2}Var(X_1+...+X_n)=\frac{1}{n^2}[(Var(X_1)+...+Var(X_n)]=\frac{1}{n^2}n\sigma^2=\frac{\sigma^2}{n}$$

 

표본평균의 평균과 표준편차: 크기 $n$인 확률표본으로부터의 표본평균 $\overline{X}$에 대하여 모평균이 $\mu$이고 모분산이 $\sigma^2$이면

$$ E(\overline{X})=\mu$$

$$ Var(\overline{X})= \frac{\sigma^2}{n}$$

$$sd (\overline{X})= \frac{\sigma}{\sqrt[]{n}}$$

 

모집단의 분포가 정규분포$N(\mu,\sigma^2)인 경우에 정규분포 성질에 따라

$$\overline{X}~N(\mu, \frac{\sigma^2}{n})$$

이 성립한다.

 

즉 표본평균의 분포는 정규분포 $N(\mu,\sigma^2)으로부터 표본평균 $ \overline{X}$는 정규분포

$N(\mu, \frac{\sigma^2}{n})$을 따른다.

 

위 내용은 모집단의 분포가 정규분포가 아닐 때에도 성립할 수 있다. 표본의 크기가 충분히 클 때에는 임의의 모집단으로부터의 표본평균이라 하더라도 그 분포가 정규분포에 근사한다는 사실이 있으며, 이것이 중심극한정리의 내용이다.

 

 

2.중심극한정리

중심극한정리 : 평균이 $\mu$이고 분산이 $\sigma^2$인 임의의 모집단으로부터의 크기 $n$인 확률표본에서의 표본평균 $\overline{X}$는 $n$이 충분히 크면 근사적으로 정규분포 $N(\mu, \frac{\sigma^2}{n})$을 따른다. 즉 $n$이 충분히 크다면

$$Z=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)$$

이 성립한다.