특이값 분해

위키백과, 우리 모두의 백과사전.
이동: 둘러보기, 검색

특이값 분해(Singular Value Decomposition, SVD)는 행렬을 특정한 구조로 분해하는 방식으로, 신호 처리통계학 등의 분야에서 자주 사용된다.

특이값 분해는 행렬의 스펙트럼 이론을 임의의 직사각행렬에 대해 일반화한 것으로 볼 수 있다. 스펙트럼 이론을 이용하면 직교 정사각행렬고윳값을 기저로 하여 대각행렬로 분해할 수 있다.

정의[편집]

실수복소수로 이루어진 K의 원소로 구성되는 m × n 행렬 M에 대해, M은 다음과 같은 세 행렬의 곱으로 분해할 수 있다.

M = U\Sigma V^*\!

여기에서 각 행렬은 다음과 같은 성질을 가진다.

행렬 M을 이와 같은 세 행렬의 곱으로 나타내는 것을 M의 특이값 분해라고 한다.

일반적으로 Σ 행렬은 더 큰 값이 먼저 나오도록, 즉 (\Sigma)_{i,i} \ge (\Sigma)_{i+1, i+1}이 되도록 구하며, 이렇게 할 경우 Σ는 M에 따라 유일하게 결정된다.

예제[편집]

다음과 같은 행렬 A가 있을 때,

A = 
\begin{bmatrix}
1 & 0 & 0 & 0 & 2\\
0 & 0 & 3 & 0 & 0\\
0 & 0 & 0 & 0 & 0\\
0 & 4 & 0 & 0 & 0\end{bmatrix}

이 행렬을 A = U \Sigma V^*로 분해하면 다음과 같다.


U = \begin{bmatrix}
0 & 0 & 1 & 0\\
0 & 1 & 0 & 0\\
0 & 0 & 0 & -1\\
1 & 0 & 0 & 0\end{bmatrix} ,

\Sigma = \begin{bmatrix}
4 & 0 & 0 & 0 & 0\\
0 & 3 & 0 & 0 & 0\\
0 & 0 & \sqrt{5} & 0 & 0\\
0 & 0 & 0 & 0 & 0\end{bmatrix} ,

V^* = \begin{bmatrix}
0 & 1 & 0 & 0 & 0\\
0 & 0 & 1 & 0 & 0\\
\sqrt{0.2} & 0 & 0 & 0 & \sqrt{0.8}\\
0 & 0 & 0 & 1 & 0\\
-\sqrt{0.8} & 0 & 0 & 0 & \sqrt{0.2}\end{bmatrix}

여기에서 특이값 분해 결과는 유일하지 않다. 예를 들어, 위의 결과에서 V^*

V^* = \begin{bmatrix} 0 & 1 & 0 & 0 & 0\\ 0 & 0 & 1 & 0 & 0\\ \sqrt{0.2} & 0 & 0 & 0 & \sqrt{0.8}\\ \sqrt{0.4} & 0 & 0 & \sqrt{0.5} & -\sqrt{0.1}\\ -\sqrt{0.4} & 0 & 0 & \sqrt{0.5} & \sqrt{0.1} \end{bmatrix}

로 교체할 수도 있다.

특이값과 특이벡터[편집]

m × n 행렬 M에 대해 다음 두 조건을 만족하는 벡터 u \in K^mv \in K^n이 존재할 때, 음수가 아닌 실수 σ를 특이값이라 부른다.

Mv = \sigma u \, , M^{*} u = \sigma v. \,\!

또한 uv를 각각 좌측 특이벡터우측 특이벡터라 부른다.

특이값 분해 M = U \Sigma V^*\!에서 Σ의 대각선 성분들은 M의 특이값이 되고 UV의 열들은 각각의 특이값에 해당하는 좌측 특이벡터와 우측 특이벡터가 된다. 또한 위 식으로부터 다음과 같은 사실도 알 수 있다.

  • m × n 행렬 M은 최소한 한개, 최대 p = min(m, n)개의 서로 다른 특이값을 갖는다.
  • M의 좌측 특이벡터들을 포함하는, Km의 유니터리 기저를 항상 찾을 수 있다.
  • M의 우측 특이벡터들을 포함하는, Kn의 유니터리 기저를 항상 찾을 수 있다.

고윳값 분해와의 관계[편집]

특이값 분해는 직교 정사각행렬만을 분해할 수 있는 고윳값 분해보다 훨씬 일반적인 행렬을 다룰 수 있지만, 두 분해는 서로 관련되어 있다.

M양의 정부호에르미트 행렬일 때 M의 모든 고윳값은 음이 아닌 실수이다. 이때 M의 특이값과 특이벡터는 M의 고윳값과 고유벡터와 같아진다.

M = V \Lambda V^* \!

더 일반적으로는, M의 특이값 분해가 주어졌을 때 다음과 같은 두 식이 성립한다.

M^* M = V \Sigma^* U^* U \Sigma V^* = V (\Sigma^* \Sigma) V^* \!
M M^* = U \Sigma V^* V \Sigma^* U^* = U (\Sigma \Sigma^* ) U^* \!

두 식의 우변은 좌변의 고윳값 분해를 나타낸다. 즉, M의 0이 아닌 특이값들의 제곱은 M*MMM*의 고윳값들과 같다. 또한 UMM*의 고유벡터이고 VM*M의 고유벡터이다.