누적 분포 함수

위키백과, 우리 모두의 백과사전.

정규 분포의 누적분포함수

확률론에서 누적분포함수(累積分布函數, 영어: cumulative distribution function, 약자 cdf)는 주어진 확률 변수가 특정 값보다 작거나 같은 확률을 나타내는 함수이다.

정의[편집]

확률 공간 위의 실숫값 확률 변수 (우연속) 누적분포함수 는 다음과 같다.

보다 일반적으로, 확률 공간 위의 실숫값 확률 벡터 (우연속) 누적분포함수 는 다음과 같다.

위 정의에 등장하는 반닫힌구간들을 열린구간으로 대체하면 좌연속 누적분포함수의 정의를 얻는다.

성질[편집]

함수로서의 성질[편집]

임의의 함수 에 대하여, 다음 두 조건이 서로 동치이다.

  • 는 어떤 확률 변수의 누적분포함수이다.
  • 다음 조건들을 만족시킨다.
    • (증가 함수) 만약 이며 라면,
    • (우연속 함수) 임의의 에 대하여,

여기서 우극한이며, 는 음과 양의 무한대에서의 극한이다.

보다 일반적으로, 임의의 함수 에 대하여, 다음 두 조건이 서로 동치이다.

  • 는 어떤 확률 벡터의 누적분포함수이다.
  • 다음 조건들을 만족시킨다.
    • 만약 이며 이라면, . (이 조건과 세 번째 조건은 가 각 변수에 대하여 증가 함수임을 함의한다.)
    • (우연속 함수) 임의의 에 대하여,
    • 임의의 에 대하여,

여기서

이다.

확률 분포와의 관계[편집]

확률 변수 또는 확률 벡터의 누적분포함수는 그 확률 분포를 유일하게 결정한다. 이는 누적분포함수에 대한 르베그-스틸티어스 측도와 일치한다. 그러나 누적분포함수는 확률 변수 자체를 유일하게 결정하지는 않는다.

확률 변수 가 구간 에 속할 확률과 특정 실수 를 취할 확률은 누적분포함수 를 통해 각각 다음과 같이 나타낼 수 있다.

보다 일반적으로, 확률 벡터 에 속할 확률과 특정 값 을 취할 확률은 각각 다음과 같다.

이산성·연속성·특이성과의 관계[편집]

이산 확률 분포, 연속 확률 분포, 이산적인 부분과 연속적인 부분이 모두 존재하는 분포에 대한 각각의 누적분포함수

확률 변수 에 대하여, 다음 두 조건이 서로 동치이다.

  • 이산 확률 변수이다. (즉, 가산 집합 이 존재한다.)

특히, 계단 함수를 누적분포함수로 하는 확률 변수이산 확률 변수이다. 그러나 그 역은 성립하지 않는다.

확률 변수 에 대하여, 다음 두 조건이 서로 동치이다.

  • 연속 확률 변수이다. (즉, 임의의 에 대하여, 이다.)
  • 연속 함수이다.

확률 변수 에 대하여, 다음 두 조건이 서로 동치이다.

확률 변수 에 대하여, 다음 두 조건이 서로 동치이다.

임의의 누적분포함수 는 이산 누적분포함수 와 절대 연속 누적분포함수 , 특이 연속 누적분포함수 의 음이 아닌 계수의 아핀 결합으로 나타낼 수 있다.

독립성과의 관계[편집]

같은 확률 공간 위의 확률 변수 또는 확률 벡터들의 집합 에 대하여, 다음 두 조건이 서로 동치이다.

  • 는 서로 독립이다.
  • 임의의 서로 다른 및 임의의 ()에 대하여,

증명:

첫 번째 조건은 두 번째 조건을 자명하게 함의한다. 이제 두 번째 조건을 가정하고 첫 번째 조건을 증명하자. 유한 개의 확률 변수

의 경우의 증명은 다음과 같다. 일반적인 경우는 이와 유사하게 증명할 수 있다.

라고 하자. 그렇다면 π계를 이루며, 를 포함하는 최소의 시그마 대수이다. 다음과 같은 집합을 생각하자.

그렇다면, 가정한 조건에 따라 이다. 또한, λ계를 이룸을 보일 수 있다. 딘킨 π-λ 정리에 따라, 이다. 이제, 다음과 같은 집합을 생각하자.

그렇다면, 이므로 이며, λ계를 이룬다. 따라서 이다. 이와 같은 과정을 반복하면 결국 임의의 에 대하여,

이라는 사실을 얻는다. 즉, 은 서로 독립이다.

참고 문헌[편집]

외부 링크[편집]