카이제곱 분포

위키백과, 우리 모두의 백과사전.

카이제곱 분포
확률 밀도 함수
누적 분포 함수
매개변수 자연수 : 자유도
지지집합 x ∈ [0, +∞)
확률 밀도
누적 분포
기댓값
중앙값
최빈값 max{ k − 2, 0 }
분산
비대칭도
첨도 12 / k
엔트로피
적률생성함수 , 단
특성함수 [1]

카이제곱 분포(χ제곱分布, 영어: chi-squared distribution) 또는 χ2 분포개의 서로 독립적인 표준정규 확률변수를 각각 제곱한 다음 합해서 얻어지는 분포이다. 이 때 k를 자유도라고 하며, 카이제곱 분포의 매개변수가 된다. 카이제곱 분포는 신뢰구간이나 가설검정 등의 모델에서 자주 등장한다.

카이제곱 분포는 감마 분포의 특수한 형태로 감마 분포에서 인 분포를 나타낸다.

정의[편집]

양의 정수 가 주어졌다고 하고, 개의 독립적이고 표준정규분포를 따르는 확률변수 를 정의하자.

그렇다면 자유도 k의 카이제곱 분포확률변수

의 분포이다. 즉, 이다.

성질[편집]

카이제곱 분포의 확률밀도함수는 다음과 같다.

여기에서 감마 함수이다.

누적분포함수는 다음과 같다.

여기에서 하부 불완전 감마 함수이다.

비대칭도, 첨도이다. 따라서 k가 충분히 크지 않은 경우 카이제곱 분포를 중심극한정리를 통해 곧바로 정규분포로 근사하는 것은 오차가 많이 발생한다. 그 대신, 다른 방식의 근사 방식이 제안되어 있다.

  • 로널드 피셔를 정규분포로 근사하는 방법을 제안했다. 이때 평균은 , 분산은 1이 된다.
  • 를 정규분포로 근사할 수 있다. 평균은 , 분산은 가 된다.

각주[편집]

  1. M.A. Sanders. “Characteristic function of the central chi-square distribution” (PDF). 2011년 7월 15일에 원본 문서 (PDF)에서 보존된 문서. 2009년 3월 6일에 확인함. 

같이 보기[편집]