누적 분포 함수

위키백과, 우리 모두의 백과사전.
이동: 둘러보기, 검색

누적 분포 함수(cumulative distribution function, cdf)는 어떤 확률 분포에 대해서, 확률 변수가 특정 값보다 작거나 같은 확률을 나타낸다. 수식으로 나타내면, 실수 범위를 가지는 확률 변수 X의 누적 분포 함수는

F_X (x) = P(X \leq x)

가 된다. 확률 변수의 종류가 확실할 경우에는 아랫 부분 첨자를 생략해 F(x)와 같이 표기하기도 한다.

확률 변수가 여러 개일 경우에도 비슷한 방법으로 누적 분포 함수를 정의할 수 있다. 예를 들어, 두 확률 변수 X, Y에 대한 누적 분포 함수 F_{X,Y}는 다음과 같다.

F_{X,Y} (x, y) = P(X \leq x, Y \leq y)

성질[편집]

이산 확률 분포, 연속 확률 분포, 이산적인 부분과 연속적인 부분이 모두 존재하는 분포에 대한 각각의 누적 분포 함수

확률 변수 X가 특정한 값 범위 (a,b]에 속할 확률은

P(a < X \leq b) = P(X \leq b) - P(X \leq a) = F (b) - F (a)

가 된다.

연속 확률 분포의 확률 밀도 함수는 연속이다. 또한 확률 밀도 함수가 모든 점에서 미분이 가능할 경우 이 확률 분포에는 확률 밀도 함수 f(x)가 존재하고,

f(x) = \frac{d}{dx} F(x)

가 성립한다.

확률 변수 X의 값이 x가 될 확률인 P(X=x)는 다음과 같이 구할 수 있다.

P(X=x) = F(x) - F(x-) = F(x) - \lim_{x \to a-0} F(a)