카이제곱 분포

위키백과, 우리 모두의 백과사전.
이동: 둘러보기, 검색
카이제곱 분포
확률밀도함수
Chi-square distributionPDF.png
누적분포함수
Chi-square distributionCDF.png
매개변수 자연수 k: 자유도
지지집합 x ∈ [0, +∞)
확률 밀도 \frac{1}{2^{k/2}\Gamma(k/2)}\; x^{k/2-1} e^{-x/2}
누적 분포 \frac{1}{\Gamma(k/2)}\;\gamma(k/2,\,x/2)
기대값 k
중앙값 \approx k\bigg(1-\frac{2}{9k}\bigg)^3
최빈값 max{ k − 2, 0 }
분산 2k
비대칭도 \scriptstyle\sqrt{8/k}
첨도 12 / k
엔트로피 \frac{k}{2}\!+\!\ln(2\Gamma(k/2))\!+\!(1\!-\!k/2)\psi(k/2)
모멘트생성함수 (1-2\,t)^{-k/2}, 단 |k| \le 1/2
특성함수 (1-2\,i\,t)^{-k/2} [1]

카이제곱 분포, χ2 분포(χ제곱分布, 영어: chi-squared distribution)는 k개의 서로 독립적인 표준정규 확률변수를 각각 제곱한 다음 합해서 얻어지는 분포이다. 이 때 k를 자유도라고 하며, 카이제곱 분포의 매개변수가 된다. 카이제곱 분포는 신뢰구간이나 가설검정 등의 모델에서 자주 등장한다.

카이제곱 분포는 감마 분포의 특수한 경우이다.

정의[편집]

양의 정수 k가 주어졌다고 하고, k개의 독립적이고 표준정규분포를 따르는 확률변수 X_1, \cdots, X_k를 정의하자. 그렇다면 자유도 k의 카이제곱 분포확률변수

Q = \sum_{i=1}^{k} X_i^2

의 분포이다. 즉, Q\sim\chi^2_k 이다.

성질[편집]

카이제곱 분포의 확률밀도함수는 다음과 같다.

f(x;\,k) = \frac{1}{2^{k/2}\Gamma(k/2)}\,x^{k/2 - 1} e^{-x/2}\, \mathbf{1}_{\{x\geq0\}}

여기에서 \Gamma(k/2)감마 함수이다.

누적분포함수는 다음과 같다.

F(x;\,k) = \frac{\gamma(k/2,\,x/2)}{\Gamma(k/2)} = P(k/2,\,x/2)

여기에서 \gamma(s,x)는 lower 불완전 감마함수이다.

비대칭도\sqrt{8/k}, 첨도12/k이다. 따라서 k가 충분히 크지 않은 경우 카이제곱 분포를 중심극한정리를 통해 곧바로 정규분포로 근사하는 것은 오차가 많이 발생한다. 그 대신, 다른 방식의 근사 방식이 제안되어 있다.

  • 로널드 피셔\sqrt{2 \chi^2_k}를 정규분포로 근사하는 방법을 제안했다. 이때 평균은 \sqrt{2k-1}, 분산은 1이 된다.
  • \sqrt[3]{\chi^2_k /k}를 정규분포로 근사할 수 있다. 평균은 1-2/(9k), 분산은 2/(9k)가 된다.

주석[편집]

  1. M.A. Sanders. Characteristic function of the central chi-square distribution. 2009년 3월 6일에 확인.

같이 보기[편집]