[통계] 정규모집단에서의 표본분포- 1.카이제곱분포

2024. 1. 22. 13:52통계

정규분포 $N(\mu,\sigma^2)$으로부터 확률표본을 $X_1,...,X_n)이라고 할 때, 표본분산 $$S^2=\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2$$ 

에 대한 표본분포는 $\sigma^2$의 추론에 유용하게 쓰인다. 이 때 표본분산 $S^2$에 관계되는 분포로 카이제곱분포(chi-square distribution)이 있다.

 

1.카이제곱분포 정의

카이제곱분포의 정의: 확률변수 $Z_1,...,Z_k$가 각각 표준정규분포 $N(0,1)$을 따르고 서로 독립일 때,

$$Z_1^2,...,Z_k^2$$

의 분포를 자유도 $k$인 카이제곱분포라고 한다. 이때 기호로서

$$ Z_1^2+...+Z_k^2~\chi^2(k)$$

로 나타낸다.

 

2.카이제곱분포의 형태

카이제곱분포를 파이썬을 이용하여 자유도에 따라서 분포의 형태가 어떻게 달라지는지 봅니다.

import numpy as np
import matplotlib.pyplot as plt
import scipy
from scipy.stats import stats
from scipy.stats import chi2

X=np.linspace(0.5,50,100)
for i in [1,2,3,4,5,10,20,30]:
    plt.plot(X,scipy.stats.chi2(i).pdf(X),label=r'$\chi^2$(' + str(i) + ')')

plt.xlabel(r'$\chi^2$')           
plt.ylabel("y")                     
plt.grid()                          
plt.title(r'$\chi^2$ Distribution with scipy.stats')    
plt.legend()                        
plt.show()

카이제곱분포의 곡선은 위 그림과 같이 자유도에 따라 다르지만 대략적인 형태는 왼쪽으로 치우쳐 있고 오른쪽으로 긴 꼬리를 가지고 있다. 그 이유는 $Z_1^2+...+Z_k^2$에서 $Z_i^2$들이 0 근처에서 주로 분포하는 확률변수들이기 때문이다.

 

'통계' 카테고리의 다른 글

[통계] $t$ 분포  (1) 2024.01.28
[통계] 표본 평균의 분포와 중심극한정리  (0) 2024.01.15
[통계] 처음부터 다시하기 - 표본분포  (0) 2024.01.12