유의 확률

위키백과, 우리 모두의 백과사전.
(P-값에서 넘어옴)
둘러보기로 가기 검색하러 가기
양쪽 꼬리 유의 확률의 정의
오른쪽 꼬리 유의 확률의 정의

통계적 가설 검정에서 유의 확률(有意 確率, 영어: significance probability, asymptotic significance) 또는 p-값(영어: p-value, probability value)은 귀무가설이 맞다고 가정할 때 얻은 결과보다 극단적인 결과가 실제로 관측될 확률이다. 실험의 유의확률은 실험표본 공간에서 정의되는 확률변수로서, 0~1 사이의 값을 가진다.

p-값귀무 가설(null hypothesis)이 맞다는 전제 하에, 표본에서 실제로 관측된 통계치와 '같거나 더 극단적인' 통계치가 관측될 확률이다. 여기서 말하는 확률은 '빈도주의' (frequentist) 확률이다.

p-value는 관찰된 데이터가 귀무가설과 양립하는 정도를 0에서 1 사이의 수치로 표현한 것이다. p-value가 작을수록 그 정도가 약하다고 보며, 특정 값 (대개 0.05나 0.01 등) 보다 작을 경우 귀무가설을 기각하는 것이 관례이나 여기에는 여러 가지 문제들이 있다.[1]

정의[편집]

주어진 표본의 유의 확률귀무가설을 가정하였을 때 표본 이상으로 극단적인 결과를 얻을 확률이다. 여기서 "더 극단적"이라는 것은 정의에 따라 다르다. 예를 들어, 정규분포의 경우, 귀무가설을 가정한 실수 확률변수 와 표본 에 대하여 왼쪽 꼬리 유의 확률(영어: left-tail p-value)

오른쪽 꼬리 유의 확률(영어: right-tail p-value)

양쪽 꼬리 유의 확률(영어: double-tail p-value)

를 정의할 수 있다.

만약 확률 변수가 단순한 실수가 아니라면, 더 복잡한 "극단성"을 정의하여야 한다. 예를 들어, 표본이 노름공간에 있는 경우, 노름함수 를 사용하여 표본 의 유의 확률을

로 정의할 수 있다.

같이 보기[편집]

외부 링크[편집]

  1. Ronald L. Wasserstein & Nicole A. Lazar (2016). “The ASA's Statement on p-Values: Context, Process, and Purpose”. 《The American Statistician》.