푸아송 분포

위키백과, 우리 모두의 백과사전.
이동: 둘러보기, 검색
푸아송 분포
확률 질량 함수
다양한 '"`UNIQ--postMath-00000029-QINU`"'에 대한 푸아송 분포의 모습
누적 분포 함수
Poisson cdf.svg
기호 ,
매개변수
지지집합 0 이상의 정수
확률 질량
누적 분포

(이때 불완전 감마 함수, 바닥 함수)

기댓값
최빈값
분산
비대칭도
적률생성함수
특성함수

확률론에서, 푸아송 분포(Poisson分布, 영어: Poisson distribution)는 단위 시간 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 이산 확률 분포이다.

역사[편집]

18세기에 시메옹 드니 푸아송이 1838년 저서 《민사 사건과 형사 사건 재판에서의 확률에 관한 연구 및 일반적인 확률 계산 법칙에 대한 서문》(프랑스어: Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du calcul des probabilitiés)[1] 에서 최초로 사용하였다.

정의[편집]

정해진 시간 안에 어떤 사건이 일어날 횟수에 대한 기댓값라고 했을 때, 그 사건이 회 일어날 확률은 다음과 같다.

여기서 자연상수이다.

특성[편집]

이 문단은 위키백과의 편집 지침에 맞춰 다듬어야 합니다. 더 좋은 문단이 되도록 문단 수정을 도와주세요. 내용에 대한 의견이 있으시다면 토론 문서에서 나누어 주세요. (2012년 3월 9일에 문단의 정리가 요청되었습니다.)
  1. 어떤 단위구간(예, 1일)동안 이를 더 짧은 작은 단위의 구간(예 : 1시간)로 나눌 수 있고 이러한 더 짧은 단위구간 중에 어떤 사건이 발생할 확률은 전체 척도 중에서 항상 일정해야 한다.
  2. 두 개 이상의 사건이 동시에 발생할 확률은 0에 가깝다.
  3. 어떤 단위구간의 사건의 발생은 다른 단위구간의 발생으로부터 독립적이다.
  4. 특정 구간에서의 사건 발생확률은 그 구간의 크기에 비례한다.
  5. 푸아송분포 확률 변수의 기댓값분산은 모두 λ이다.

응용[편집]

다음과 같은 확률적인 문제를 알아내기 위해 쓰이고 있다.

  • 일정 주어진 시간 동안에 도착한 고객의 수
  • 1킬로미터 도로에 있는 흠집의 수
  • 일정 주어진 생산시간 동안 발생하는 불량 수
  • 하룻동안 발생하는 출생자 수
  • 어떤 시간 동안 톨게이트를 통과하는 차량의 수
  • 어떤 페이지 하나를 완성하는 데 발생하는 오타의 발생률
  • 어떤 특정량의 방사선을 DNA에 쬐였을때 발생하는 돌연변이의 수
  • 어떤 특정 면적의 다양한 종류의 나무가 섞여 자라는 삼림에서 소나무의 수
  • 어떤 특정 진도 이상의 지진이 발생하는 수

푸아송 가정에 어긋나는 사례[편집]

  • 1분마다 학생 조합에 도착할 학생들의 수는 푸아송 분포를 따르지 않을 수도 있다. 왜냐하면, 그 비율이 일정하지 않기 때문이다. (수업 중에는 그 비율이 낮고, 쉬는 시간에는 그 비율이 높을 것이다.) 또, 각 학생들의 도착 사건이 독립적이지 않다. (학생들은 보통 그룹지어서 이동하는 경향이 있다)
  • 매년 캘리포니아에서 진도 5의 지진 발생 수는 푸아송 분포를 따르지 않을 것이다. 왜냐하면 한 번의 지진이 그 다음 일어날 지진의 가능성에 영향을 끼치기 때문이다.
  • 집중 치료 병동의 환자들 중, 그 병동에서 보낼 날의 수는 푸아송 분포를 따르지 않을 것이다. 왜냐하면, 병동에서 하루도 지내지 않는 경우는 없기 때문이다. 이러한 경우 zero-truncated poisson distribution을 통한 모델링이 가능하다.
  • 한 번도 사건이 일어나지 않는 시간 간격의 수가 기본 푸아송 분포를 통해 예측된 것보다 더 많은 경우 (쉽게 생각하면 푸아송 분포에서 계산된 P(k=0)보다 더 높은 P(k=0)을 가지는 경우), zero-inflated 모델을 적용할 수 있다.

이항 분포와의 관계[편집]

푸아송 분포는 이항 분포의 특수한 형태로 볼 수 있다.

이항분포를 따르는 위와 같은 확률변수 X에서, n이 대단히 크고 p가 대단히 작을 경우, 이 확률변수 X는 λ=np인 푸아송 분포로 근사할 수 있다.

예를 들어 DNA에 방사선을 쬐었을 때, 각 염기쌍이 돌연변이를 일으킬 확률은 각각 매우 작고 서로 독립적이다. 또한 하나의 DNA에는 많은 염기쌍이 있다. 따라서 DNA에 방사선을 쬐었을 때 발생하는 돌연변이의 개수는 푸아송 분포로 나타낼 수 있다.

참고 문헌[편집]

  1. Poisson, S.D. (1837). 《Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du calcul des probabilitiés》 (프랑스어). Paris, France: Bachelier. 

외부 링크[편집]