표준 편차

위키백과, 우리 모두의 백과사전.

각 밴드의 너비가 1 표준편차인 정규분포의 구상. 68-95-99.7 규칙 참고.
예측값 0과 표준편차 1을 나타낸 정규분포의 누적 확률.

표준 편차(標準 偏差, 영어: standard deviation, SD)는 통계집단의 분산의 정도 또는 자료의 산포도를 나타내는 수치로, 분산의 음이 아닌 제곱근 즉, 분산을 제곱근한 것으로 정의된다. 표준편차가 작을수록 평균값에서 변량들의 거리가 가깝다.[1] 통계학확률에서 주로 확률의 분포, 확률변수 혹은 측정된 인구나 중복집합에 적용된다. 관례에 따라 모집단은 그리스문자로 표본은 영어 알파벳으로 표기하는데, 모집단의 표준편차는 (시그마)로, 표본의 표준편차는 (에스)로 나타낸다.[2]

편차(deviation)는 관측값에서 평균 또는 중앙값을 뺀 것이다.

분산(variance)은 관측값에서 평균을 뺀 값을 제곱하고, 그것을 모두 더한 후 전체 갯수로 나눠서 구한다. 즉, 차이값의 제곱의 평균이다. 관측값에서 평균을 뺀 값인 편차를 모두 더하면 0이 나오므로 제곱해서 더한다.

표준 편차(standard deviation)는 분산을 제곱근한 것이다. 편차들(deviations)의 제곱합(SS, sum of square)에서 얻어진 값의 평균치인 분산의 성질로부터 다시 제곱근해서 원래 단위로 만들어줌으로써 얻게된다.

모 표준 편차(population standard deviation) σ는 모집단의 표준 편차이다. 모 분산 σ2에 제곱근을 씌워서 구한다.

표본 표준 편차(sample standard deviation) s는 표본의 표준 편차이다. 표본 분산 s2에 제곱근을 씌워서 구한다.

정의[편집]

확률 변수 X기댓값 라 하자. 이 때 모집단 X의 표준편차 는 다음과 같이 정의한다.[3]

유도과정에서 기댓값의 성질이 사용되었다. 표준편차는 분산의 제곱근과 같은 의미를 가진다.

통계적 추정[편집]

동일 경중률인 경우[편집]

경중률이 동일한 경우 표본 내의 어떤 변인 x가 가지는 모집단에서 표본(sample)의 표준편차의 추정치 s는 다음과 같다.

 : 표본의 표준편차
 : 변인
 : 표본의 평균
 : 표본의 크기
 : 잔차

분모를 n-1로 나누는 이유는 분산을 계산할 때 모평균이 아닌 표본 평균을 사용했기 때문에 모집단의 편의 추정량(biased estimator)이 되므로, 분산이 불편 추정량(unbiased estimator)이 되도록 하기 위해서이다.[4] n-1을 자유도(degree of freedom)라고 본다.[5]

경중률이 다른 경우[편집]

경중률을 w라 할 때, 인 경우에는 표본(sample) 표준편차 s를 다음과 같이 구한다.[4]

같이 보기[편집]

각주[편집]

  1. 이재기; 최석근; 박경식; 정성혁 (2013). 《측량학1》 2판. 형설출판사. 76-77쪽. ISBN 978-89-472-7336-7. 
  2. “List of Probability and Statistics Symbols”. 《Math Vault》 (미국 영어). 2020년 4월 26일. 2020년 8월 21일에 확인함. 
  3. 송성주, 전명식. 《수리통계학》. 자유아카데미. 57쪽. 
  4. 이재기; 최석근; 박경식; 정성혁 (2013). 《측량학1》 2판. 형설출판사. 77쪽. ISBN 978-89-472-7336-7. 
  5. 이재기; 최석근; 박경식; 정성혁 (2013). 《측량학1》 2판. 형설출판사. 76쪽. ISBN 978-89-472-7336-7.