표본 분포

위키백과, 우리 모두의 백과사전.

표본 분포(sampling distribution 또는 finite-sample distribution) 또는 표집분포는 크기 n의 확률 표본(random sample)의 확률 변수(random variable)의 분포(distribution)이다. 하나의 표본으로부터 계산된 통계량(statistic)은 여러가지가 있을 수 있으나 평균을 가장 많이 사용하므로 아래에서 평균을 사용한 표본 분포를 대표적으로 기술한다.

표본 평균의 분포[편집]

모집단에서 임의로 추출된 표본의 평균을 표본 평균이라고 하며 표본 평균도 그 값이 변하는 확률 변수인데 그 확률 분포표본 평균분포라고한다. 이 확률 분포로부터 표본 평균()들 간의 평균분산도 구할 수 있다. 이 분포에 대해 일반적으로 다음과 같은 사실이 알려지고 있다. 정규 분포 를 하는 모집단으로부터의 크기 인 임의표본의 평균 의 분포에 대하여

  • [1] ,
  • [2] 의 분포는 이다.
  • [3] 모집단이 정규분포하지 않아도 이 충분히 크면 위의 사실이 근사적으로 성립한다.

이것이 중심 극한 정리의 주요한 부분이며 이 정리에 의하면 모집단정규 분포를 따르지 않아도 이 분포는 정규 분포를 따른다. 이 것을 이용해 통계적 추론을 하게 된다. 표준 오차는 이 분포의 표준 편차이다.

이항 분포의 경우는 이 충분히 커질 때(보통 일 때), 로 근사할 수 있다.

표집분포[편집]

특히 표집 분포(sampling distribution)은 연구 대상이 되는 모집단에서 다중 복수의 표본들을 추출한 자료들을 통해서 통계적 가설을 검증할 때 필요한 분포이다. 따라서 모집단으로부터의 충분한 여러 표집(sampling)에서 얻게되는 표본들의 표본평균들은 표집분포를 갖게되고 이 표집분포는 모집단의 분포에 수렴한다. 이러한 중심극한정리(cetral limit theorem)에서 표집분포의 평균값()은 모집단의 평균값()에 근사하게 된다.

표준오차[편집]

표집오차(sampling error)는 모집단의 표준편차에 근사한다.

같이 보기[편집]

참고[편집]

외부 링크[편집]