헤세 행렬

위키백과, 우리 모두의 백과사전.
이동: 둘러보기, 검색
미적분학
v  d  e  h

수학에서 헤세행렬(Hessian matrix)은 어떤 함수의 이계도함수를 행렬로 표현한 것이다. 헤세행렬은 독일의 수학자 루트비히 오토 헤세의 이름을 따서 명명되었다. 헤세행렬은 다변수함수가 극값을 가질 때, 그것이 극대인지, 극소인지 판정할 때 사용한다.

정의[편집]

실함수 f(x_{1}, x_{2}, x_{3}, ..., x_{n})이 주어졌을 때, 헤세행렬은 다음과 같이 주어진다.

H(f) = \begin{bmatrix}
\frac{\partial^{2} f}{\partial x_{1}^2} & \frac{\partial^{2} f}{\partial x_{1} \partial x_{2}} & \cdots & \frac{\partial^{2} f}{\partial x_{1} \partial x_{n}} \\
\frac{\partial^{2} f}{\partial x_{2} \partial x_{1}} & \frac{\partial^{2} f}{\partial x_{2}^2} & \cdots & \vdots \\
\vdots & \vdots & \ddots & \vdots \\
\frac{\partial^{2} f}{\partial x_{n} \partial x_{1}} & \cdots & \cdots & \frac{\partial^{2} f}{\partial x_{n}^2}
\end{bmatrix}

헤세행렬은, 함수의 기울기 벡터 \nabla f에 대한 야코비행렬로도 설명이 가능하다.

함수 f의 이계도함수가 연속이라면 혼합 편미분은 같다. 그 때 이 행렬은 대칭행렬이다.

테일러급수와 헤세행렬[편집]

함수 f:U\sub\mathbb{R}^n\to\mathbb{R}n=2테일러급수는 헤세행렬을 이용해서 나태낼 수 있다.

\mathbf{h}\in\mathbb{R}^n에 대해 f\left(\mathbf{x}_0+\mathbf{h}\right) =f\left(\mathbf{x}_0\right) +J\left(\mathbf{x}_0\right)\mathbf{h}+\mathbf{h}^TH\left( f\right)\left(\mathbf{x}_0\right)\left(\mathbf{h}\right) (여기서 \mathbf{h}^T\mathbf{h}가 열벡터라고 할때 그 전치행렬인 행벡터를 의미한다.)

만약 \mathbf{x}_0임계점이라면 \mathbf{D}f\left(\mathbf{x}_0\right) =0이므로 \mathbf{h}\in\mathbb{R}^n에 대해 f\left(\mathbf{x}_0+\mathbf{h}\right) =f\left(\mathbf{x}_0\right) +\mathbf{h}^TH\left( f\right)\left(\mathbf{x}_0\right)\left(\mathbf{h}\right) 이다. 즉, 상수가 아닌 가장 첫 번째 항이 바로 헤세행렬이 되는 셈이다.

함께 보기[편집]