t-검정

t-검정 (t-test) 또는 스튜던트 t-테스트 (Student's t-test)는 검정통계량이 귀무가설 하에서 t-분포를 따르는 통계적 가설 검정법이다.

t-테스트는 일반적으로 검정통계량이 정규 분포를 따르며 분포와 관련된 스케일링 변숫값들이 알려진 경우에 사용한다. 이때 모집단의 분산과 같은 스케일링 항을 알 수 없으나, 이를 데이터를 기반으로 한 추정값으로 대체하면 검정통계량은 t-분포를 따른다. 예를 들어 t-테스트를 사용하여 두 데이터 세트(집단)의 평균이 서로 유의하게 다른지 여부를 판별할 수 있다.

역사

t-분포는 1876년에 프리드리히 로베르트 헬메르트와^[1]^[2]^[3] 야콥 뤼로스에^[4]^[5]^[6] 의해 사후검정법 중 하나로 유도되는데, 1895년에는 칼 피어슨에 의해 피어슨 분포 4형의 특별한 꼴임이 밝혀졌다.^[7] 스튜던트 t 분포라는 이름은 1906년부터 1907년까지 유니버시티 칼리지 런던의 칼 피어슨 휘하 연구실에 있었던^[8] 윌리엄 실리 고셋이 1908년 과학 학술지인 《바이오메트리카_Biometrika》에 스튜던트라는 필명으로^{[주해 1]} 논문을 제출한 데에서 기인했다.^[10]^[11] 로널드 피셔가 이 분포를 소개하면서 '스튜던트 t-분포', '스튜던트 t-테스트'라는 이름을 사용해 널리 알려지게 되었다.^[12]

예

t-테스트는 독립된 또는 종속된(대응된) 두집단의 비교에서 유용하다. 일반적인 연구설계나 논문등에서 t-검정(t檢定)은 두 평균 등 비교값이 의미 있게 차이가 나는지를 검사하는 방법으로 많이 사용된다. 영가설 하에서 t-분포를 이루는 통계치를 사용한다. t-테스트는 일반적으로 영가설 기각여부에 앞서서 등분산성(homoskedasticity)을 검증하는 전단계를 갖는다. 스튜던트 t-검정(Student t檢定)으로도 불리며 두 표본 평균 간의 차이에 대한 유의성을 결정하는 데 유용한 통계적 방법이다.

통계프로그램

IBM SPSS는 T-테스트에서 영가설의 임계치(α) 영역(영가설 기각 유무)을 확인할 수 있는 P값(유의확률)인 sig를 제시한다. PSPP에서도 이와같이 sig 값을 보여준다.

(예) α < sig(P) 이면 영가설 채택(영가설 기각불가)

(예) α > sig(P) 이면 영가설 기각 (대립가설 채택 - 통계적으로 유의미하다)

이러한 IBM SPSS , PSPP, R, SAS등의 통계프로그램의 가설검증은 가독성을 높이는 P값(유의확률) sig를 보여준다는 점에서 T-테스트뿐만아니라 분산분석,회귀분석등에서 일관되게 편리성을 제공한다.

Z테스트

Z-테스트로부터 T-테스트 값을 계산하여 추정할 수 있다.

T=Z10+50

같이 보기

주해

↑ 고셋을 고용한 기네스에서는 기업의 비밀 엄수를 위해 원래 논문의 발표를 허용하지 않았으나, 특별히 필명을 사용한다는 조건으로 허용한 것이다.^[9]

각주

↑ Szabó, István (2003), 《Einführung in die Technische Mechanik》 (Springer Berlin Heidelberg), 196–199쪽, doi:10.1007/978-3-642-61925-0_16, ISBN 978-3-540-13293-6 |제목=이(가) 없거나 비었음 (도움말); |장=이 무시됨 (도움말)
↑ Schlyvitch, B. (October 1937). “Untersuchungen über den anastomotischen Kanal zwischen der Arteria coeliaca und mesenterica superior und damit in Zusammenhang stehende Fragen”. 《Zeitschrift für Anatomie und Entwicklungsgeschichte》 107 (6): 709–737. doi:10.1007/bf02118337. ISSN 0340-2061. S2CID 27311567.
↑ Helmert (1876). “Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit”. 《Astronomische Nachrichten》 (독일어) 88 (8–9): 113–131. Bibcode:1876AN.....88..113H. doi:10.1002/asna.18760880802.
↑ Lüroth, J. (1876). “Vergleichung von zwei Werthen des wahrscheinlichen Fehlers”. 《Astronomische Nachrichten》 (독일어) 87 (14): 209–220. Bibcode:1876AN.....87..209L. doi:10.1002/asna.18760871402.
↑ Pfanzagl J, Sheynin O (1996). "Studies in the history of probability and statistics. XLIV. A forerunner of the t-distribution". Biometrika. 83 (4): 891–898. doi:10.1093/biomet/83.4.891. MR 1766040.
↑ Sheynin, Oscar (1995). “Helmert's work in the theory of errors”. 《Archive for History of Exact Sciences》 (영어) 49 (1): 73–104. doi:10.1007/BF00374700. ISSN 0003-9519. S2CID 121241599.
↑ Pearson, K. (1895-01-01). "Contributions to the Mathematical Theory of Evolution. II. Skew Variation in Homogeneous Material". Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences. 186: 343–414 (374). doi:10.1098/rsta.1895.0010. ISSN 1364-503X
↑ Raju, T. N. (2005). “William Sealy Gosset and William A. Silverman: Two "students" of science”. 《Pediatrics》 116 (3): 732–5. doi:10.1542/peds.2005-1134. PMID 16140715. S2CID 32745754.
↑ Wendl MC (2016). "Pseudonymous fame". Science. 351 (6280): 1406. doi:10.1126/science.351.6280.1406. PMID 27013722
↑ "Student" William Sealy Gosset (1908). "The probable error of a mean" (PDF). Biometrika. 6 (1): 1–25. doi:10.1093/biomet/6.1.1. hdl:10338.dmlcz/143545. JSTOR 2331554
↑ “T Table | History of T Table, Etymology, one-tail T Table, two-tail T Table and T-statistic”.
↑ Walpole, Ronald E. (2006). 《Probability & statistics for engineers & scientists》. Myers, H. Raymond. 7판. New Delhi: Pearson. ISBN 81-7758-404-9. OCLC 818811849.

[10] 고셋을 고용한 기네스에서는 기업의 비밀 엄수를 위해 원래 논문의 발표를 허용하지 않았으나, 특별히 필명을 사용한다는 조건으로 허용한 것이다.^[9]

[1] Szabó, István (2003), 《Einführung in die Technische Mechanik》 (Springer Berlin Heidelberg), 196–199쪽, doi:10.1007/978-3-642-61925-0_16, ISBN 978-3-540-13293-6 |제목=이(가) 없거나 비었음 (도움말); |장=이 무시됨 (도움말)

[2] Schlyvitch, B. (October 1937). “Untersuchungen über den anastomotischen Kanal zwischen der Arteria coeliaca und mesenterica superior und damit in Zusammenhang stehende Fragen”. 《Zeitschrift für Anatomie und Entwicklungsgeschichte》 107 (6): 709–737. doi:10.1007/bf02118337. ISSN 0340-2061. S2CID 27311567.

[3] Helmert (1876). “Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit”. 《Astronomische Nachrichten》 (독일어) 88 (8–9): 113–131. Bibcode:1876AN.....88..113H. doi:10.1002/asna.18760880802.

[4] Lüroth, J. (1876). “Vergleichung von zwei Werthen des wahrscheinlichen Fehlers”. 《Astronomische Nachrichten》 (독일어) 87 (14): 209–220. Bibcode:1876AN.....87..209L. doi:10.1002/asna.18760871402.

[5] Pfanzagl J, Sheynin O (1996). "Studies in the history of probability and statistics. XLIV. A forerunner of the t-distribution". Biometrika. 83 (4): 891–898. doi:10.1093/biomet/83.4.891. MR 1766040.

[6] Sheynin, Oscar (1995). “Helmert's work in the theory of errors”. 《Archive for History of Exact Sciences》 (영어) 49 (1): 73–104. doi:10.1007/BF00374700. ISSN 0003-9519. S2CID 121241599.

[7] Pearson, K. (1895-01-01). "Contributions to the Mathematical Theory of Evolution. II. Skew Variation in Homogeneous Material". Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences. 186: 343–414 (374). doi:10.1098/rsta.1895.0010. ISSN 1364-503X

[8] Raju, T. N. (2005). “William Sealy Gosset and William A. Silverman: Two "students" of science”. 《Pediatrics》 116 (3): 732–5. doi:10.1542/peds.2005-1134. PMID 16140715. S2CID 32745754.

[9] Wendl MC (2016). "Pseudonymous fame". Science. 351 (6280): 1406. doi:10.1126/science.351.6280.1406. PMID 27013722

[11] "Student" William Sealy Gosset (1908). "The probable error of a mean" (PDF). Biometrika. 6 (1): 1–25. doi:10.1093/biomet/6.1.1. hdl:10338.dmlcz/143545. JSTOR 2331554

[12] “T Table | History of T Table, Etymology, one-tail T Table, two-tail T Table and T-statistic”.

[13] Walpole, Ronald E. (2006). 《Probability & statistics for engineers & scientists》. Myers, H. Raymond. 7판. New Delhi: Pearson. ISBN 81-7758-404-9. OCLC 818811849.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[주해 1]

[10]

[11]

[12]

[9]