스튜던트 t 분포

위키백과, 우리 모두의 백과사전.
(T 분포에서 넘어옴)
이동: 둘러보기, 검색
스튜던트 t 분포
확률밀도함수
Student t pdf.svg
누적분포함수
Student t cdf.svg
매개변수 \nu > 0 자유도(실수값)
지지집합 x \in (-\infty; +\infty)\!
확률 밀도 \frac{\Gamma \left(\frac{\nu+1}{2} \right)} {\sqrt{\nu\pi}\,\Gamma \left(\frac{\nu}{2} \right)} \left(1+\frac{x^2}{\nu} \right)^{-\left(\frac{\nu+1}{2} \right)}\!
누적 분포 \begin{matrix} \frac{1}{2} + x \Gamma \left( \frac{\nu+1}{2} \right) \cdot\\[0.5em] \frac{\,_2F_1 \left ( \frac{1}{2},\frac{\nu+1}{2};\frac{3}{2}; -\frac{x^2}{\nu} \right)} {\sqrt{\pi\nu}\,\Gamma \left(\frac{\nu}{2}\right)} \end{matrix}, 여기에서 \,_2 F_1초기하함수
기대값 \nu>1일때 0, 나머지는 정의되지 않음
중앙값 0
최빈값 0
분산 \frac{\nu}{\nu-2}(\nu>2), \infty(1<\nu\le2), 나머지는 정의되지 않음
비대칭도 \nu>3일때 0
모멘트생성함수 정의되지 않음
특성함수 \frac{K_{\nu/2} \left(\sqrt{\nu}|t|)(\sqrt{\nu}|t| \right)^{\nu/2}}{\Gamma(\nu/2)2^{\nu/2-1}},\;\nu>0, K_{\nu}(x)베셀 함수

스튜던트 t 분포(Student t分布, 영어: Student’s t-distribution)는 정규 분포의 평균을 측정할 때 주로 사용되는 분포이다.

정의[편집]

스튜던트 t 분포는 다음 확률변수의 분포로 정의된다.

\frac{Z}{\sqrt{V/\nu}}

여기에서 Z표준정규분포, V자유도 \nu카이제곱 분포이다.

t 분포는 종모양으로서 t=0에서 좌우대칭을 이룬다. t 분포의 모양을 결정하는 것은 자유도이며, 자유도가 커질수록 표준정규분포에 가깝게된다. [1]:194

정규분포에서의 추정[편집]

어떤 정규분포의 평균\mu이고 분산\sigma^2일 때, 그 분포에서 n개의 표본을 추출한 것을 X_1, \cdots, X_n라고 표기한다. 표본평균과 표본분산은 다음과 같다.

\overline{X}_n = \frac{1}{n}(X_1+\cdots+X_n)
S_n^{\;2} = \frac{1}{n-1}\sum_{i=1}^n\left(X_i-\overline{X}_n\right)^2

이 값들은 실제 평균과 분산에 대한 불편추정값이다. 이때,

V = (n-1)\frac{S_n^2}{\sigma^2}

은 자유도가 n-1카이제곱 분포가 된다는 것이 Cochran 정리에 의해 알려져 있다. 또한

Z = \left(\overline{X}_n-\mu\right)\frac{\sqrt{n}}{\sigma}

는 평균이 0이고 분산이 1인 정규분포를 가지며, V, Z는 서로 독립이라는 것을 증명할 수 있다.

이때 Z에서 \sigma^2 대신 S_n^{\;2}로 대체한 추축량(pivot quantity)은 다음과 같다.

T \equiv \frac{Z}{\sqrt{V/\nu}} = \left(\overline{X}_n-\mu\right)\frac{\sqrt{n}}{S_n}

이때 T에는 \sigma^2가 사용되지 않으므로, 이 분포는 분산을 모를 때의 평균값 \mu를 추정하는 데에 사용이 가능하다. 이때 T의 분포는 자유도 n-1인 t-분포가 된다.

구간 추정[편집]

자유도 n-1인 t 분포 T에 대해,

\Pr(-A<T<A) = 0.9

을 만족하는 실수 A는 수치적으로 계산이 가능하다. 이때,

\Pr(-A<T<A) = \Pr\left(-A < {\overline{X}_n - \mu \over S_n/\sqrt{n}} < A \right) =  \Pr\left(\overline{X}_n - A{S_n \over \sqrt{n}} < \mu < \overline{X}_n + A{S_n \over \sqrt{n}}\right) = 0.9

이므로, 정규분포의 평균은 90%의 신뢰도로 \overline{X}_n\pm A\frac{S_n}{\sqrt{n}} 신뢰구간에 속하게 된다.

역사[편집]

프리드리히 로베르트 헬메르트(독일어: Friedrich Robert Helmert)가 1875년에 도입하였다.[2][3][4][5] 이듬해 야코프 뤼로트(독일어: Jacob Lüroth)도 같은 분포를 재발견하였다.[6][7] 그러나 헬메르트와 뤼로트의 논문은 영문 학계에 널리 알려지지 않았다.

1908년에 윌리엄 고셋이 "스튜던트"(영어: Student, ‘학생’)라는 필명으로 1908년 재발견하였다.[8] 고셋은 기네스 양조 공장에서 일했고, 맥주에 사용되는 보리의 질을 시험하기 위해 이 분포를 도입하였고, 경쟁사들에게 기네스의 획기적인 통계 기법을 숨기기 위해 필명을 사용하였다고 한다.[9]:326 이후 저명한 통계학자인 로널드 피셔는 이 분포를 "스튜던트 분포"라고 불렀고, t라는 기호를 사용하였다.[10] 피셔 이후 이 분포는 고셋의 필명을 따 "스튜던트 t 분포"로 알려지게 되었다.

참고 문헌[편집]

  1. (한국어) 김석우 (2007년). 《기초통계학》. 학지사
  2. (독일어) Helmert, F. R. (1875년). Ueber die Berechnung des wahrscheinlichen Fehlers aus einer endlichen Anzahl wahrer Beobachtungsfehler. 《Zeitschrift für Mathematik und Physik》 20: 300–303. JFM 07.0113.01.
  3. (독일어) Helmert, F. R. (1876년). Ueber die Wahrscheinlichkeit der Potenzsummen der Beobachtungsfehler und über einige damit im Zusammenhange stehende Fragen. 《Zeitschrift für Mathematik und Physik》 21: 192–218. JFM 08.0113.02.
  4. (독일어) Helmert, F. R. (1876년). Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit. 《Astronomische Nachrichten》 88: 113–32. doi:10.1002/asna.18760880802. Bibcode1876AN.....88..113H. JFM 08.0114.01.
  5. (독일어) Sheynin, O. (1995년). Helmert’s work in the theory of errors. 《Archive for History of Exact Sciences》 49: 73–104. doi:10.1007/BF00374700. ISSN 0003-9519.
  6. (독일어) Lüroth, J (1876년). Vergleichung von zwei Werthen des wahrscheinlichen Fehlers. 《Astronomische Nachrichten》 87 (14): 209–20. doi:10.1002/asna.18760871402. Bibcode1876AN.....87..209L. JFM 07.0109.02.
  7. (영어) Pfanzagl, J., O. Sheynin (1996년). A forerunner of the t-distribution (Studies in the history of probability and statistics XLIV). 《Biometrika》 83 (4): 891–898. doi:10.1093/biomet/83.4.891. MR1766040.
  8. (영어) Student (1908년 3월). The probable error of a mean. 《Biometrika》 6 (1): 1–25. doi:10.1093/biomet/6.1.1.
  9. Mortimer, Robert G. (2005년). 《Mathematics for Physical Chemistry》, 3판, Academic Press. ISBN 0-12-508347-5
  10. (영어) Fisher, R. A. (1925년). Applications of "Student's" distribution. 《Metron》 5: 90–104.

같이 보기[편집]