카이제곱 분포

위키백과, 우리 모두의 백과사전.
이동: 둘러보기, 찾기
카이제곱 분포
확률밀도함수
Chi-square distributionPDF.png
누적분포함수
Chi-square distributionCDF.png
매개변수 자연수 k: 자유도
받침 x ∈ [0, +∞)
pdf \frac{1}{2^{k/2}\Gamma(k/2)}\; x^{k/2-1} e^{-x/2}
cdf \frac{1}{\Gamma(k/2)}\;\gamma(k/2,\,x/2)
기대값 k
중앙값 \approx k\bigg(1-\frac{2}{9k}\bigg)^3
최빈값 max{ k − 2, 0 }
분산 2k
왜도 \scriptstyle\sqrt{8/k}
첨도 12 / k
엔트로피 \frac{k}{2}\!+\!\ln(2\Gamma(k/2))\!+\!(1\!-\!k/2)\psi(k/2)
mgf (1-2\,t)^{-k/2}, 단 |k| \le 1/2
cf (1-2\,i\,t)^{-k/2} [1]

카이제곱 분포, χ² 분포k개의 서로 독립적인 표준정규 확률변수를 각각 제곱한 다음 합해서 얻어지는 분포이다. 이 때 k를 자유도라고 하며, 카이제곱 분포의 매개변수가 된다. 카이제곱 분포는 신뢰구간이나 가설검정 등의 모델에서 자주 등장한다.

카이제곱 분포는 감마 분포의 특수한 경우가 된다.

목차

[편집] 정의

X_1, \cdots, X_kk개의 독립적이고 표준정규분포를 따르는 확률변수라고 할 때,

Q = \sum_{i=1}^{k} X_i^2

로 정의하는 확률변수 Q의 분포를 자유도가 k인 카이제곱 분포로 정의한다. 이에 대한 표기는 보통 Q \sim\ \chi^2(k)나 :Q \sim\ \chi^2_k로 나타낸다.

[편집] 성질

카이제곱 분포의 확률밀도함수는 다음과 같다.

f(x;\,k) = \frac{1}{2^{k/2}\Gamma(k/2)}\,x^{k/2 - 1} e^{-x/2}\, \mathbf{1}_{\{x\geq0\}}

여기에서 \Gamma(k/2)감마 함수이다.

누적분포함수는 다음과 같다.

F(x;\,k) = \frac{\gamma(k/2,\,x/2)}{\Gamma(k/2)} = P(k/2,\,x/2)

비대칭도\sqrt{8/k}, 첨도12/k이다. 따라서 k가 충분히 크지 않은 경우 카이제곱 분포를 중심극한정리를 통해 곧바로 정규분포로 근사하는 것은 오차가 많이 발생한다. 그 대신, 다른 방식의 근사 방식이 제안되어 있다.

  • 로널드 피셔\sqrt{2 \chi^2_k}를 정규분포로 근사하는 방법을 제안했다. 이때 평균은 \sqrt{2k-1}, 분산은 1이 된다.
  • \sqrt[3]{\chi^2_k /k}를 정규분포로 근사할 수 있다. 평균은 1-2/(9k), 분산은 2/(9k)가 된다.

[편집] 주석

  1. M.A. Sanders. Characteristic function of the central chi-square distribution. 2009년 3월 6일에 확인.

[편집] 같이 보기