통계(4)
-
[통계] $t$ 분포
$X_1,...,X_n$이 정규모집단 $N(\mu,\sigma^2)$으로부터의 확률표본일 때. 표본평균 $\overline{X}$에 대해서 $$\overline{X} \sim N(\mu,\frac{\sigma^2}{n}) , \frac{\overline{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)$$ 이 성립하는데 $\mu$에 관한 통계적 추론에서 $\sigma$가 미지인 경우에는 $\sigma$ 대신에 표본표준편차 $S=\sqrt{\sum_{i=1}^{n}(X_i-\overline{X})^2/(n-1)}$을 대입하여 스튜던트화(studentized)된 확률변수 $$\frac{\overline{X}-\mu}{S/\sqrt{n}}$$ 의 분포를 필요로 하는 경우가 많다. 위와 같은 확..
2024.01.28 -
[통계] 정규모집단에서의 표본분포- 1.카이제곱분포
정규분포 $N(\mu,\sigma^2)$으로부터 확률표본을 $X_1,...,X_n)이라고 할 때, 표본분산 $$S^2=\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2$$ 에 대한 표본분포는 $\sigma^2$의 추론에 유용하게 쓰인다. 이 때 표본분산 $S^2$에 관계되는 분포로 카이제곱분포(chi-square distribution)이 있다. 1.카이제곱분포 정의 카이제곱분포의 정의: 확률변수 $Z_1,...,Z_k$가 각각 표준정규분포 $N(0,1)$을 따르고 서로 독립일 때, $$Z_1^2,...,Z_k^2$$ 의 분포를 자유도 $k$인 카이제곱분포라고 한다. 이때 기호로서 $$ Z_1^2+...+Z_k^2~\chi^2(k)$$ 로 나타낸다. 2.카이제곱분포의 ..
2024.01.22 -
[통계] 표본 평균의 분포와 중심극한정리
1. 표본평균의 평균과 표준편차 $X_1,...,X_n$을 모평균 $\mu$, 모분산 $\sigma^2$인 모집단으로부터의 확률표본이라고 할 때, 이 확률표본으로부터의 표본평균 $\overline{X}= \sum_{i=1}^{n}X_i/n$을 생각해본다. 분포에 대한 성질을 알기 위해 표본평균의 기대값과 분산을 구해본다. 기대값의 가법성으로부터 표본평균의 기대값은 $$E(\overline{X})=\frac{1}{n}E(X_1+...+X_n)=\frac{1}{n}[(E(X_1)+...+E(X_n)]=\frac{1}{n}n\mu=\mu$$ 이고, $\overline{X}$의 분산은 $X_1,...,X_n$이 서로 독립이므로 분산의 가법성을 이용하여 $$Var(\overline{X})=\frac{1}{n^2}..
2024.01.15 -
[통계] 처음부터 다시하기 - 표본분포
최근 통계에 대해 수업을 들으면서 많은 것을 잊었다는 것을 알았습니다. 그래서 예전 전공 통계책을 꺼내서 다시 한번 정리하는 시간을 가지려고 합니다. 1. 확률표본(random sample) - 모집단의 분포와 확률표본 a) 미지인 모집단의 분포는 확률밀도함수 $f(x)$ 로 나타낸다. b) 모집단 $f(x)$로부터의 확률표본$X_1,...,X_n$이란 $f(x)$를 확률밀도함수로 갖는 서로 독립인 확률변수들을 뜻한다. 즉 어떤 회사에서 생산하는 전구의 수명시간에 대해 알기 위해, 100개의 전구를 표본으로 택해서 수명시간을 기록했다. 이 때 전구의 생산량이 무수히 많다고 가정한다면, 100개의 전구 표본은 모집단의 분포를 가지고, 분포에 대한 미지의 확률분포를 결정할 수 있다. 또한 100개의 샘플은 ..
2024.01.12