정규분포

위키백과, 우리 모두의 백과사전.
이동: 둘러보기, 검색
정규 분포
확률밀도함수
정규분포의 확률밀도함수
붉은 색은 표준정규분포
누적분포함수
정규분포의 누적밀도함수
확률밀도함수의 색과 같은 색
매개변수 \mu 평균
\sigma^2>0 분산
지지집합 x \in (-\infty;+\infty)\!
확률 밀도 \frac1{\sigma\sqrt{2\pi}}\; \exp\left(-\frac{\left(x-\mu\right)^2}{2\sigma^2} \right) \!
누적 분포 \frac12 \left(1 + \mathrm{erf}\,\frac{x-\mu}{\sigma\sqrt2}\right) \!
기댓값 \mu
중앙값 \mu
최빈값 \mu
분산 \sigma^2
비대칭도 0
첨도 0
엔트로피 \ln\left(\sigma\sqrt{2\,\pi\,e}\right)\!
모멘트생성함수 M_X(t) = \exp\left(\mu\,t+\frac{\sigma^2 t^2}{2}\right)
특성함수 \phi_X(t) = \exp\left(\mu\,i\,t-\frac{\sigma^2 t^2}{2}\right)

확률론통계학에서, 정규분포(正規分布, 영어: normal distribution) 또는 가우스 분포(Gauß分布, 영어: Gaussian distribution)는 연속 확률 분포의 하나이다. 정규분포는 수집된 자료의 분포를 근사하는 데에 자주 사용되며, 이것은 중심극한정리에 의하여 독립적인 확률변수들의 평균은 정규분포에 가까워지는 성질이 있기 때문이다.

정규분포는 2개의 매개 변수 평균 \mu표준편차 \sigma에 대해 모양이 결정되고, 이때의 분포를 \mathrm{N}(\mu, \sigma^2)로 표기한다. 특히, 평균이 0이고 표준편차가 1인 정규분포 \mathrm{N}(0, 1)표준정규분포라고 한다.

역사[편집]

정규분포는 아브라앙 드 무아브르1733년 쓴 글에서 특정 이항 분포n이 클 때 그 분포의 근사치를 계산하는 것과 관련하여 처음 소개되었고 이 글은 그의 저서 《우연의 교의》 2판(1738년)에 다시 실렸다. 피에르시몽 라플라스는 그의 저서 《확률론의 해석이론》(1812년)에서 이 결과를 확장하였고 이는 오늘날 드무아브르-라플라스의 정리로 알려져있다.

라플라스는 실험 오차를 분석하면서 정규분포를 사용했다. 1805년에는 아드리앵마리 르장드르가 매우 중요한 방법인 최소제곱법을 도입했다. 카를 프리드리히 가우스는 이 방법을 1794년부터 사용해왔다고 주장했는데 1809년에는 실험 오차가 정규분포를 따른다는 가정하에 최소제곱법을 이론적으로 엄밀히 정당화했다.

성질[편집]


\begin{align}
\bar x&= \int_{-\infty}^{\infty}\frac{x}{\sigma\sqrt{2\pi}}\; \exp\left[-\frac{\left(x-\mu\right)^2}{2\sigma^2} \right]\\
&= \frac{\sqrt{2}\sigma}{\sqrt{\pi}}\int_{-\infty}^{\infty}y \exp[-y^{2}]dy
   + \frac{\mu}{\sqrt{\pi}}\int_{-\infty}^{\infty}\exp[-y^{2}]dy
\end{align}

위에서 첫 번째 적분은 기함수의 적분으로 0이고 두 번째 적분은 가우스 적분으로 적분값이 \sqrt{\pi}로 잘 알려져 있다. 따라서 기대값은 \mu다.

  • 정규분포는 절대근사한다.
  • 정규분포는 평균과 표준편차가 주어져 있을 때 엔트로피를 최대화하는 분포이다.
  • 정규분포곡선은 좌우 대칭이며 하나의 꼭지를 가진다.
  • 정규분포는 중앙치에 사례 수가 모여있고, 양극단으로 갈수록 X축에 무한히 접근하지만 X축에 닿지는 않는다.[1]

참고 문헌[편집]

  1. 김석우, 《기초통계학》, 학지사, 2007, p,83

같이 보기[편집]

바깥 고리[편집]