[통계] 정규모집단에서의 표본분포- 1.카이제곱분포
2024. 1. 22. 13:52ㆍ통계
정규분포 $N(\mu,\sigma^2)$으로부터 확률표본을 $X_1,...,X_n)이라고 할 때, 표본분산 $$S^2=\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2$$
에 대한 표본분포는 $\sigma^2$의 추론에 유용하게 쓰인다. 이 때 표본분산 $S^2$에 관계되는 분포로 카이제곱분포(chi-square distribution)이 있다.
1.카이제곱분포 정의
카이제곱분포의 정의: 확률변수 $Z_1,...,Z_k$가 각각 표준정규분포 $N(0,1)$을 따르고 서로 독립일 때,
$$Z_1^2,...,Z_k^2$$
의 분포를 자유도 $k$인 카이제곱분포라고 한다. 이때 기호로서
$$ Z_1^2+...+Z_k^2~\chi^2(k)$$
로 나타낸다.
2.카이제곱분포의 형태
카이제곱분포를 파이썬을 이용하여 자유도에 따라서 분포의 형태가 어떻게 달라지는지 봅니다.
import numpy as np
import matplotlib.pyplot as plt
import scipy
from scipy.stats import stats
from scipy.stats import chi2
X=np.linspace(0.5,50,100)
for i in [1,2,3,4,5,10,20,30]:
plt.plot(X,scipy.stats.chi2(i).pdf(X),label=r'$\chi^2$(' + str(i) + ')')
plt.xlabel(r'$\chi^2$')
plt.ylabel("y")
plt.grid()
plt.title(r'$\chi^2$ Distribution with scipy.stats')
plt.legend()
plt.show()
카이제곱분포의 곡선은 위 그림과 같이 자유도에 따라 다르지만 대략적인 형태는 왼쪽으로 치우쳐 있고 오른쪽으로 긴 꼬리를 가지고 있다. 그 이유는 $Z_1^2+...+Z_k^2$에서 $Z_i^2$들이 0 근처에서 주로 분포하는 확률변수들이기 때문이다.
'통계' 카테고리의 다른 글
[통계] $t$ 분포 (1) | 2024.01.28 |
---|---|
[통계] 표본 평균의 분포와 중심극한정리 (0) | 2024.01.15 |
[통계] 처음부터 다시하기 - 표본분포 (0) | 2024.01.12 |