정규 분포의 누적분포함수
확률론에서 누적분포함수(累積分布函數, 영어: cumulative distribution function, 약자 cdf)는 주어진 확률 변수가 특정 값보다 작거나 같은 확률을 나타내는 함수이다.
확률 공간
위의 실숫값 확률 변수
의 (우연속) 누적분포함수
는 다음과 같다.
![{\displaystyle F_{X}(x)=\operatorname {Pr} (X\in (-\infty ,x])\qquad \forall x\in \mathbb {R} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/7654dbf1b059eefd111959d4bf47c113f70b450a)
보다 일반적으로, 확률 공간
위의 실숫값 확률 벡터
의 (우연속) 누적분포함수
는 다음과 같다.
![{\displaystyle F_{X}(x_{1},\dots ,x_{n})=\operatorname {Pr} (X_{1}\in (-\infty ,x_{1}],\dots ,X_{n}\in (-\infty ,x_{n}])\qquad \forall (x_{1},\dots ,x_{n})\in \mathbb {R} ^{n}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ecd188f6810d74d22ef861263cd08f628fa42561)
위 정의에 등장하는 반닫힌구간들을 열린구간으로 대체하면 좌연속 누적분포함수의 정의를 얻는다.
함수로서의 성질[편집]
임의의 함수
에 대하여, 다음 두 조건이 서로 동치이다.
는 어떤 확률 변수의 누적분포함수이다.
- 다음 조건들을 만족시킨다.
- (증가 함수) 만약
이며
라면, ![{\displaystyle F(x)\leq F(y)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bd530364fe7c9f29566d822de1a3f5a0a9985779)
- (우연속 함수) 임의의
에 대하여, ![{\displaystyle F(x^{+})=F(x)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/91d604bf659e35e6ef9c42a9a9cdd701a8babd01)
![{\displaystyle F(-\infty )=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9c5b6d5a8155587b1c0c8f679508014e857ff8ec)
![{\displaystyle F(\infty )=1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4ebad0cf4017231f5d7f3301729c138c6dd42c15)
여기서
는 우극한이며,
와
는 음과 양의 무한대에서의 극한이다.
보다 일반적으로, 임의의 함수
에 대하여, 다음 두 조건이 서로 동치이다.
는 어떤 확률 벡터의 누적분포함수이다.
- 다음 조건들을 만족시킨다.
- 만약
이며
이라면,
. (이 조건과 세 번째 조건은
가 각 변수에 대하여 증가 함수임을 함의한다.)
- (우연속 함수) 임의의
에 대하여, ![{\displaystyle F(x^{+})=F(x)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/91d604bf659e35e6ef9c42a9a9cdd701a8babd01)
- 임의의
및
에 대하여, ![{\displaystyle F(x_{1},\dots ,x_{i-1},-\infty ,x_{i+1},\dots ,x_{n})=0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2fa0ba86e57a83ccce1a4321fca5a8799ea9f314)
![{\displaystyle F(\infty ,\dots ,\infty )=1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6521c5dbd5f7fc01854d4c3755a4091c433bd506)
여기서
![{\displaystyle F(x^{+})=\lim _{y_{1}\to x_{1}^{+},\dots ,y_{n}\to x_{n}^{+}}F(y)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b3814ddb14fdcc78cdaa27765f323911c58b7288)
![{\displaystyle F(x_{1},\dots ,x_{i-1},-\infty ,x_{i+1},\dots ,x_{n})=\lim _{x_{i}\to -\infty }F(x)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f94d9a4f2a9ab18bf1c9ab27191086dd0a9ac787)
![{\displaystyle F(\infty ,\dots ,\infty )=\lim _{x_{1}\to \infty ,\dots ,x_{n}\to \infty }F(x)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/980936f98a1ad6e30769157b824c823576384d04)
이다.
확률 분포와의 관계[편집]
확률 변수 또는 확률 벡터의 누적분포함수는 그 확률 분포를 유일하게 결정한다. 이는 누적분포함수에 대한 르베그-스틸티어스 측도와 일치한다. 그러나 누적분포함수는 확률 변수 자체를 유일하게 결정하지는 않는다.
확률 변수
가 구간
에 속할 확률과 특정 실수
를 취할 확률은 누적분포함수
를 통해 각각 다음과 같이 나타낼 수 있다.
![{\displaystyle \operatorname {Pr} (X\in (a,b])=F_{X}(b)-F_{X}(a)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/30c2bba5b59191df7215c6bb4d12a2be281c3054)
![{\displaystyle \operatorname {Pr} (X=x)=F_{X}(x)-F_{X}(x^{-})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/46c03cc72e89e765fd5adf3f05af6db2fa6aa865)
보다 일반적으로, 확률 벡터
가
에 속할 확률과 특정 값
을 취할 확률은 각각 다음과 같다.
![{\displaystyle \operatorname {Pr} (X_{1}\in (a_{1},b_{1}],\dots ,X_{n}\in (a_{n},b_{n}])=\sum _{t\in \{a_{1},b_{1}\}\times \cdots \times \{a_{n},b_{n}\}}(-1)^{|\{i\colon t_{i}=a_{i}\}|}F_{X}(t)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ee90a9065c1342194d7ab5b43ebafc50711c2bcf)
![{\displaystyle \operatorname {Pr} (X_{1}=x_{1},\dots ,X_{n}=x_{n})=\lim _{\epsilon \to 0^{+}}\sum _{t\in \{x_{1}-\epsilon ,x_{1}\}\times \cdots \times \{x_{n}-\epsilon ,x_{n}\}}(-1)^{|\{i\colon t_{i}=x_{i}-\epsilon \}|}F_{X}(t)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/77a638ae5ce09118a80220677f195426d1194df6)
이산성·연속성·특이성과의 관계[편집]
이산 확률 분포, 연속 확률 분포, 이산적인 부분과 연속적인 부분이 모두 존재하는 분포에 대한 각각의 누적분포함수
확률 변수
에 대하여, 다음 두 조건이 서로 동치이다.
는 이산 확률 변수이다. (즉,
인 가산 집합
이 존재한다.)
![{\displaystyle \textstyle \sum _{x\in \mathbb {R} }\left(F_{X}(x)-\lim _{y\to x^{-}}F_{X}(y)\right)=1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/99ebe3d71ea6a7a519336be1fec1ea9deeff6128)
특히, 계단 함수를 누적분포함수로 하는 확률 변수는 이산 확률 변수이다. 그러나 그 역은 성립하지 않는다.
확률 변수
에 대하여, 다음 두 조건이 서로 동치이다.
는 연속 확률 변수이다. (즉, 임의의
에 대하여,
이다.)
는 연속 함수이다.
확률 변수
에 대하여, 다음 두 조건이 서로 동치이다.
는 절대 연속 확률 변수이다. (즉, 확률 분포
는 르베그 측도에 대한 절대 연속 측도이다. 또는,
는 확률 밀도 함수를 갖는다.)
는 임의의 닫힌구간에서 절대 연속 함수이다.
확률 변수
에 대하여, 다음 두 조건이 서로 동치이다.
는 특이 확률 변수이다. (즉, 확률 분포
와 르베그 측도는 서로 특이 측도이다.)
- 르베그 거의 어디서나
이다.
임의의 누적분포함수
는 이산 누적분포함수
와 절대 연속 누적분포함수
, 특이 연속 누적분포함수
의 음이 아닌 계수의 아핀 결합으로 나타낼 수 있다.
![{\displaystyle F=cF_{\operatorname {disc} }+c'F_{\operatorname {a.c.} }+c''F_{\operatorname {s.c.} }}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7195ed624a17838410424a0e0f0598b6cba12dd4)
![{\displaystyle c,c',c''\geq 0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3d9e4e674a2d6ed9bfc963ca5d9006a4e6e3772e)
![{\displaystyle c+c'+c''=1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9a8af9ba0e2f1fc686cf3821b73e00d794fe86ee)
독립성과의 관계[편집]
같은 확률 공간 위의 확률 변수 또는 확률 벡터들의 집합
에 대하여, 다음 두 조건이 서로 동치이다.
는 서로 독립이다.
- 임의의 서로 다른
및 임의의
(
)에 대하여, ![{\displaystyle F_{(X_{1},\dots ,X_{n})}(x_{1},\dots ,x_{n})=F_{X_{1}}(x_{1})\cdots F_{X_{n}}(x_{n})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6eca7a5694a0c60a1429fd41afaa2ea081cf162a)
첫 번째 조건은 두 번째 조건을 자명하게 함의한다. 이제 두 번째 조건을 가정하고 첫 번째 조건을 증명하자. 유한 개의 확률 변수
![{\displaystyle {\mathcal {X}}=\{X_{1},\dots ,X_{n}\}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/70ada59ecc918cc3a1b9bcfd425d2e547e676762)
![{\displaystyle X_{i}\colon (\Omega ,{\mathcal {F}},\operatorname {Pr} )\to (\mathbb {R} ,{\mathcal {B}}(\mathbb {R} ))}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7cfaa195f023dd94bc3c1b3b81b9682adfbf3ec4)
의 경우의 증명은 다음과 같다. 일반적인 경우는 이와 유사하게 증명할 수 있다.
![{\displaystyle {\mathcal {C}}=\{(-\infty ,x]\colon x\in \mathbb {R} \}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/addef3a095c928fe7620949b590337d8af9cc134)
라고 하자. 그렇다면
는 π계를 이루며,
는
를 포함하는 최소의 시그마 대수이다. 다음과 같은 집합을 생각하자.
![{\displaystyle {\mathcal {L}}_{n}=\{B_{n}\in {\mathcal {B}}(\mathbb {R} )|\forall B_{1},\dots ,B_{n-1}\in {\mathcal {C}}\colon \operatorname {Pr} (X_{1}\in B_{1},\dots ,X_{n}\in B_{n})=\operatorname {Pr} (X_{1}\in B_{1})\cdots \operatorname {Pr} (X_{n}\in B_{n})\}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/86d3462b8054662b0a5d53acd9e0b4ff51e4ccb2)
그렇다면, 가정한 조건에 따라
이다. 또한,
은 λ계를 이룸을 보일 수 있다. 딘킨 π-λ 정리에 따라,
이다. 이제, 다음과 같은 집합을 생각하자.
![{\displaystyle {\mathcal {L}}_{n-1}=\{B_{n-1}\in {\mathcal {B}}(\mathbb {R} )|\forall B_{1},\dots ,B_{n-2}\in {\mathcal {C}},B_{n}\in {\mathcal {B}}(\mathbb {R} )\colon \operatorname {Pr} (X_{1}\in B_{1},\dots ,X_{n}\in B_{n})=\operatorname {Pr} (X_{1}\in B_{1})\cdots \operatorname {Pr} (X_{n}\in B_{n})\}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a307b222e63456ab6951e54b8e3bb468a3f9f260)
그렇다면,
이므로
이며,
은 λ계를 이룬다. 따라서
이다. 이와 같은 과정을 반복하면 결국 임의의
에 대하여,
![{\displaystyle \operatorname {Pr} (X_{1}\in B_{1},\dots ,X_{n}\in B_{n})=\operatorname {Pr} (X_{1}\in B_{1})\cdots \operatorname {Pr} (X_{n}\in B_{n})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e5a7ae856c1901a6544dc9ad5599c3f3496ebcaf)
이라는 사실을 얻는다. 즉,
은 서로 독립이다.
같이 보기[편집]
참고 문헌[편집]
외부 링크[편집]