점 분포 모델

위키백과, 우리 모두의 백과사전.
이동: 둘러보기, 검색

점 분포 모델(point distribution model)은 특정 물체의 형태(shape)을 수개의 학습 데이터로 부터 평균 형태와 그에 따른 통계적 유형으로 표현하는 모델을 의미한다. 이 때, 유형의 갯수는 형태의 차원보다 작은 숫자로 평균 형태 유형의 선형 조합으로 학습 데이터의 형상을 표현할 수 있다.

배경[편집]

점 분포 모델은 Cootes[1] Taylor et al.[2]가 제안하였고, 이는 능동적 형태 모델(active shape model)과 능동적 외양 모델(active appearance model)에 사용되었다.

자세히[편집]

특정 물체(예: 얼굴)를 포함하고 있는 모든 학습영상에 대해 같은 위치에 k개의 점(landmark)이 찍혀 있어야 한다. 이 작업은 주로 수작업으로 이루어지기 때문에 매우 지루한 작업이지만 점 제대로 된 분포 모델의 생성을 위한 필수 작업이다. 학습 영상에서 물체의 위치, 크기, 회전 등이 다르기 때문에 일반적 프로크루스테스 분석(generalized procrustes analysis)으로 정규화한다. k개의 정규화된 2차원 점들은

\mathbf{X} = (x_1, y_1, \ldots, x_k, y_k), \mathbf{X} \in \mathbb{R}^{2k}.

모든 학습데이터를 모아 이에 대한 평균을 \overline{\mathbf{X}}라 하고, 공분산 행렬(covariance matrix)을 \Sigma라 한다. \Sigma\mathbb{R}^{2k \times 2k}이다. \Sigma주성분 분석(Principal Component Analysis, PCA)를 이용하여 2k개의 고유벡터(eigenvector)와 2k개의 고윳값을 구한다. 고윳값을 내림차순으로 정렬한 후 상위 d개에 해당하는 고유벡터를 모아 \mathbf{P} \in \mathbb{R}^{2k \times d}의 행렬을 생성한다. 새로운 형태 \mathbf{X}'

\mathbf{X}' = \overline{\mathbf{X}} + \mathbf{P} \mathbf{b},

\mathbf{b} \in \mathbb{R}^{d \times 1}\mathbf{P}의 각 벡터에 곱해지는 값의 벡터이다. \mathbf{b}의 값이 변함에 따라 다양한 형태의 \mathbf{X}'가 생성될 수 있다. \mathbf{X}'가 학습 데이터 내의 형상만을 표현하기 위해서 \mathbf{b}의 값을 특정 범위 내에서 제한할 수 있다. \mathbf{b}의 각 요소는 그에 해당하는 고유벡터의 표준편차에 대해  \pm 3 \times 표준편차내에서 정할 수 있다. 고유벡터의 표준편차는 해당 고윳값의 제곱근으로 정의한다.

참조[편집]

  1. T. F. Cootes (2004년 May월). 《Statistical models of appearance for computer vision
  2. D.H. Cooper, T.F. Cootes, C.J. Taylor and J. Graham (1995). 《Active shape models—their training and application》, 38–59쪽