카이제곱 분포

카이제곱 분포
확률 밀도 함수
누적 분포 함수
매개변수	자연수 : 자유도
지지집합	x ∈ [0, +∞)
확률 밀도
누적 분포
기댓값
중앙값
최빈값	max{ k − 2, 0 }
분산
비대칭도
첨도	12 / k
엔트로피
적률생성함수	, 단
특성함수

카이제곱 분포(χ제곱分布, 영어: chi-squared distribution) 또는 χ² 분포는 $k$ 개의 서로 독립적인 표준정규 확률변수를 각각 제곱한 다음 합해서 얻어지는 분포이다. 이 때 k를 자유도라고 하며, 카이제곱 분포의 매개변수가 된다. 카이제곱 분포는 신뢰구간이나 가설검정 등의 모델에서 자주 등장한다.

카이제곱 분포는 감마 분포의 특수한 형태로 감마 분포에서 $k=\nu /2,\theta =2$ 인 분포를 나타낸다.

f(x;\,k)={\frac {1}{2^{k/2}\Gamma (k/2)}}\,x^{k/2-1}e^{-x/2}\,\mathbf {1} _{\{x\geq 0\}}

정의[편집]

양의 정수 $k$ 가 주어졌다고 하고, $k$ 개의 독립적이고 표준정규분포를 따르는 확률변수 $X_{1},\cdots ,X_{k}$ 를 정의하자.

그렇다면 자유도 k의 카이제곱 분포는 확률변수

Q=\sum _{i=1}^{k}X_{i}^{2}

의 분포이다. 즉, $Q\sim \chi _{k}^{2}$ 이다.

성질[편집]

카이제곱 분포의 확률밀도함수는 다음과 같다.

f(x;\,k)={\frac {1}{2^{k/2}\Gamma (k/2)}}\,x^{k/2-1}e^{-x/2}\,\mathbf {1} _{\{x\geq 0\}}

여기에서 $\Gamma (k/2)$ 는 감마 함수이다.

누적분포함수는 다음과 같다.

F(x;\,k)={\frac {\gamma (k/2,\,x/2)}{\Gamma (k/2)}}=P(k/2,\,x/2)

여기에서 $\gamma (s,x)$ 는 하부 불완전 감마 함수이다.

비대칭도는 ${\sqrt {8/k}}$ , 첨도는 $12/k$ 이다. 따라서 k가 충분히 크지 않은 경우 카이제곱 분포를 중심극한정리를 통해 곧바로 정규분포로 근사하는 것은 오차가 많이 발생한다. 그 대신, 다른 방식의 근사 방식이 제안되어 있다.

로널드 피셔는 ${\sqrt {2\chi _{k}^{2}}}$ 를 정규분포로 근사하는 방법을 제안했다. 이때 평균은 ${\sqrt {2k-1}}$ , 분산은 1이 된다.
${\sqrt[{3}]{\chi _{k}^{2}/k}}$ 를 정규분포로 근사할 수 있다. 평균은 $1-2/(9k)$ , 분산은 $2/(9k)$ 가 된다.

각주[편집]

↑ M.A. Sanders. “Characteristic function of the central chi-square distribution” (PDF). 2011년 7월 15일에 원본 문서 (PDF)에서 보존된 문서. 2009년 3월 6일에 확인함.

같이 보기[편집]

[1] M.A. Sanders. “Characteristic function of the central chi-square distribution” (PDF). 2011년 7월 15일에 원본 문서 (PDF)에서 보존된 문서. 2009년 3월 6일에 확인함.

[1]

v t e 확률 분포
연속	베타 코시 카이제곱 지수 F 감마 곰퍼츠 라플라스 로지스틱 로그 정규 정규 파레토 스튜던트 t 연속균등 베이불 굼벨
이산	베르누이 이항 이산균등 기하 초기하 음이항 푸아송
확률분포 목록