2013년 10월 18일 (금) 23:24 판
수학에서 헤시안 행렬 (Hessian matrix), 또는 헤세의 행렬 은 어떤 함수의 이계도함수 를 행렬로 표현한 것이다. 이 행렬은 독일의 수학자 루트비히 오토 헤세 의 이름을 따서 명명되었다. 헤시안 행렬은 다변수함수가 극값을 가질 때, 그것이 극대인지, 극소인지 판정할 때 사용한다.
정의
실변수 함수
f
(
x
1
,
x
2
,
x
3
,
.
.
.
,
x
n
)
{\displaystyle f(x_{1},x_{2},x_{3},...,x_{n})}
이 주었을 때, 헤시안 행렬은 다음과 같이 주어진다.
H
(
f
)
=
[
∂
2
f
∂
x
1
2
∂
2
f
∂
x
1
∂
x
2
⋯
∂
2
f
∂
x
1
∂
x
n
∂
2
f
∂
x
2
∂
x
1
∂
2
f
∂
x
2
2
⋯
⋮
⋮
⋮
⋱
⋮
∂
2
f
∂
x
n
∂
x
1
⋯
⋯
∂
2
f
∂
x
n
2
]
{\displaystyle H(f)={\begin{bmatrix}{\frac {\partial ^{2}f}{\partial x_{1}^{2}}}&{\frac {\partial ^{2}f}{\partial x_{1}\partial x_{2}}}&\cdots &{\frac {\partial ^{2}f}{\partial x_{1}\partial x_{n}}}\\{\frac {\partial ^{2}f}{\partial x_{2}\partial x_{1}}}&{\frac {\partial ^{2}f}{\partial x_{2}^{2}}}&\cdots &\vdots \\\vdots &\vdots &\ddots &\vdots \\{\frac {\partial ^{2}f}{\partial x_{n}\partial x_{1}}}&\cdots &\cdots &{\frac {\partial ^{2}f}{\partial x_{n}^{2}}}\end{bmatrix}}}
헤시안 행렬은, 함수의 기울기벡터
∇
f
{\displaystyle \nabla f}
에 대한 야코비 행렬 로도 설명이 가능하다.
함수
f
{\displaystyle f}
의 이계도함수가 연속 이라면 혼합 편미분은 같다. 그 때 이 행렬은 대칭행렬 이다.
테일러 급수와 헤시안 행렬
함수
f
:
U
⊂
R
n
→
R
{\displaystyle f:U\subset \mathbb {R} ^{n}\to \mathbb {R} }
의
n
=
2
{\displaystyle n=2}
인 테일러 급수 는 헤시안 행렬을 이용해서 나태낼 수 있다.
h
∈
R
n
{\displaystyle \mathbf {h} \in \mathbb {R} ^{n}}
에 대해
f
(
x
0
+
h
)
=
f
(
x
0
)
+
J
(
x
)
h
+
h
T
H
(
f
)
(
x
0
)
(
h
)
{\displaystyle f\left(\mathbf {x} _{0}+\mathbf {h} \right)=f\left(\mathbf {x} _{0}\right)+J\left(\mathbf {x} \right)\mathbf {h} +\mathbf {h} ^{T}H\left(f\right)\left(\mathbf {x} _{0}\right)\left(\mathbf {h} \right)}
(여기서
h
T
{\displaystyle \mathbf {h} ^{T}}
는
h
{\displaystyle \mathbf {h} }
가 열벡터라고 할때 그 전치행렬 인 행벡터를 의미한다.)
만약
x
0
{\displaystyle \mathbf {x} _{0}}
가 임계점 이라면
D
f
(
x
0
)
=
0
{\displaystyle \mathbf {D} f\left(\mathbf {x} _{0}\right)=0}
이므로
h
∈
R
n
{\displaystyle \mathbf {h} \in \mathbb {R} ^{n}}
에 대해
f
(
x
0
+
h
)
=
f
(
x
0
)
+
h
T
H
(
f
)
(
x
0
)
(
h
)
{\displaystyle f\left(\mathbf {x} _{0}+\mathbf {h} \right)=f\left(\mathbf {x} _{0}\right)+\mathbf {h} ^{T}H\left(f\right)\left(\mathbf {x} _{0}\right)\left(\mathbf {h} \right)}
이다. 즉, 상수가 아닌 가장 첫번째 항이 바로 헤시안 행렬이 되는 셈이다.
함께 보기