배깅

위키백과, 우리 모두의 백과사전.

배깅(영어: bagging)은 bootstrap aggregating의 줄임말로 통계적 분류회귀 분석에서 사용되는 기계 학습 알고리즘의 안정성과 정확도를 향상시키기 위해 고안된 일종의 앙상블 학습법메타 알고리즘이다. 또한 배깅은 분산을 줄이고 과적합(overfitting)을 피하도록 해준다. 결정 트리 학습법이나 랜덤 포레스트에만 적용되는 것이 일반적이기는 하나, 그 외의 다른 방법들과 함께 사용할 수 있다.

설명[편집]

크기 n인 훈련 집합(training set) 가 주어졌을 때, 배깅은 복원 표본추출(sampling with replacement) 방법과 균등 확률분포를 이용해 각각의 크기가 n′ 인 m개의 새로운 훈련 집합 을 생성한다. 복원 표본추출 이기 때문에 일부 관측 데이터는 각 에 반복해서 나타날 수 있다. 이러한 샘플을 부트스트랩(bootstrap) 샘플이라 한다. m개의 모델은 m개의 부트스트랩 샘플들을 이용해 만들어지고 결과를 평균(회귀분석의 경우) 또는 투표(분류의 경우)를 통해 결합한다.

같이 보기[편집]

각주 및 참고자료[편집]