Processing math: 100%

[통계] 정규모집단에서의 표본분포- 1.카이제곱분포

2024. 1. 22. 13:52통계

정규분포 N(μ,σ2)으로부터 확률표본을 $X_1,...,X_n)이라고 할 때, 표본분산 S2=1n1ni=1(XiX)2 

에 대한 표본분포는 σ2의 추론에 유용하게 쓰인다. 이 때 표본분산 S2에 관계되는 분포로 카이제곱분포(chi-square distribution)이 있다.

 

1.카이제곱분포 정의

카이제곱분포의 정의: 확률변수 Z1,...,Zk가 각각 표준정규분포 N(0,1)을 따르고 서로 독립일 때,

Z21,...,Z2k

의 분포를 자유도 k인 카이제곱분포라고 한다. 이때 기호로서

Z21+...+Z2k χ2(k)

로 나타낸다.

 

2.카이제곱분포의 형태

카이제곱분포를 파이썬을 이용하여 자유도에 따라서 분포의 형태가 어떻게 달라지는지 봅니다.

import numpy as np
import matplotlib.pyplot as plt
import scipy
from scipy.stats import stats
from scipy.stats import chi2

X=np.linspace(0.5,50,100)
for i in [1,2,3,4,5,10,20,30]:
    plt.plot(X,scipy.stats.chi2(i).pdf(X),label=r'$\chi^2$(' + str(i) + ')')

plt.xlabel(r'$\chi^2$')           
plt.ylabel("y")                     
plt.grid()                          
plt.title(r'$\chi^2$ Distribution with scipy.stats')    
plt.legend()                        
plt.show()

카이제곱분포의 곡선은 위 그림과 같이 자유도에 따라 다르지만 대략적인 형태는 왼쪽으로 치우쳐 있고 오른쪽으로 긴 꼬리를 가지고 있다. 그 이유는 Z21+...+Z2k에서 Z2i들이 0 근처에서 주로 분포하는 확률변수들이기 때문이다.

 

'통계' 카테고리의 다른 글

[통계] t 분포  (1) 2024.01.28
[통계] 표본 평균의 분포와 중심극한정리  (0) 2024.01.15
[통계] 처음부터 다시하기 - 표본분포  (0) 2024.01.12