헤세 행렬: 두 판 사이의 차이
내용 삭제됨 내용 추가됨
잔글 →테일러 급수와 헤시안 행렬: 1번째→1 번째 using AWB |
편집 요약 없음 |
||
1번째 줄: | 1번째 줄: | ||
{{미적분학}} |
{{미적분학}} |
||
수학에서 ''' |
수학에서 '''헤세행렬'''(Hessian matrix)은 어떤 함수의 [[이계도함수]]를 행렬로 표현한 것이다. 헤세행렬은 독일의 수학자 [[루트비히 오토 헤세]]의 이름을 따서 명명되었다. 헤세행렬은 다변수함수가 극값을 가질 때, 그것이 극대인지, 극소인지 판정할 때 사용한다. |
||
== 정의 == |
== 정의 == |
||
실함수 <math>f(x_{1}, x_{2}, x_{3}, ..., x_{n})</math>이 주어졌을 때, 헤세행렬은 다음과 같이 주어진다. |
|||
:<math>H(f) = \begin{bmatrix} |
:<math>H(f) = \begin{bmatrix} |
||
\frac{\partial^{2} f}{\partial x_{1}^2} & \frac{\partial^{2} f}{\partial x_{1} \partial x_{2}} & \cdots & \frac{\partial^{2} f}{\partial x_{1} \partial x_{n}} \\ |
\frac{\partial^{2} f}{\partial x_{1}^2} & \frac{\partial^{2} f}{\partial x_{1} \partial x_{2}} & \cdots & \frac{\partial^{2} f}{\partial x_{1} \partial x_{n}} \\ |
||
11번째 줄: | 11번째 줄: | ||
\frac{\partial^{2} f}{\partial x_{n} \partial x_{1}} & \cdots & \cdots & \frac{\partial^{2} f}{\partial x_{n}^2} |
\frac{\partial^{2} f}{\partial x_{n} \partial x_{1}} & \cdots & \cdots & \frac{\partial^{2} f}{\partial x_{n}^2} |
||
\end{bmatrix}</math> |
\end{bmatrix}</math> |
||
헤세행렬은, 함수의 기울기 벡터 <math>\nabla f</math>에 대한 [[야코비행렬]]로도 설명이 가능하다. |
|||
함수 <math>f</math>의 이계도함수가 [[연속함수|연속]]이라면 혼합 편미분은 같다. 그 때 이 행렬은 [[대칭행렬]]이다. |
함수 <math>f</math>의 이계도함수가 [[연속함수|연속]]이라면 혼합 편미분은 같다. 그 때 이 행렬은 [[대칭행렬]]이다. |
||
== 테일러급수와 헤세행렬 == |
|||
== 테일러 급수와 헤시안 행렬 == |
|||
{{참고| |
{{참고|테일러급수}} |
||
함수 <math>f:U\sub\mathbb{R}^n\to\mathbb{R}</math>의 <math>n=2</math>인 [[ |
함수 <math>f:U\sub\mathbb{R}^n\to\mathbb{R}</math>의 <math>n=2</math>인 [[테일러급수]]는 헤세행렬을 이용해서 나태낼 수 있다. |
||
:<math>\mathbf{h}\in\mathbb{R}^n</math>에 대해 <math>f\left(\mathbf{x}_0+\mathbf{h}\right) =f\left(\mathbf{x}_0\right) +J\left(\mathbf{x}\right)\mathbf{h}+\mathbf{h}^TH\left( f\right)\left(\mathbf{x}_0\right)\left(\mathbf{h}\right)</math> (여기서 <math>\mathbf{h}^T</math>는 <math>\mathbf{h}</math>가 열벡터라고 할때 그 [[전치행렬]]인 행벡터를 의미한다.) |
:<math>\mathbf{h}\in\mathbb{R}^n</math>에 대해 <math>f\left(\mathbf{x}_0+\mathbf{h}\right) =f\left(\mathbf{x}_0\right) +J\left(\mathbf{x}\right)\mathbf{h}+\mathbf{h}^TH\left( f\right)\left(\mathbf{x}_0\right)\left(\mathbf{h}\right)</math> (여기서 <math>\mathbf{h}^T</math>는 <math>\mathbf{h}</math>가 열벡터라고 할때 그 [[전치행렬]]인 행벡터를 의미한다.) |
||
만약 <math>\mathbf{x}_0</math>가 [[임계점]]이라면 <math>\mathbf{D}f\left(\mathbf{x}_0\right) =0</math>이므로 <math>\mathbf{h}\in\mathbb{R}^n</math>에 대해 <math>f\left(\mathbf{x}_0+\mathbf{h}\right) =f\left(\mathbf{x}_0\right) +\mathbf{h}^TH\left( f\right)\left(\mathbf{x}_0\right)\left(\mathbf{h}\right)</math> 이다. 즉, 상수가 아닌 가장 첫 번째 항이 바로 |
만약 <math>\mathbf{x}_0</math>가 [[임계점]]이라면 <math>\mathbf{D}f\left(\mathbf{x}_0\right) =0</math>이므로 <math>\mathbf{h}\in\mathbb{R}^n</math>에 대해 <math>f\left(\mathbf{x}_0+\mathbf{h}\right) =f\left(\mathbf{x}_0\right) +\mathbf{h}^TH\left( f\right)\left(\mathbf{x}_0\right)\left(\mathbf{h}\right)</math> 이다. 즉, 상수가 아닌 가장 첫 번째 항이 바로 헤세행렬이 되는 셈이다. |
||
== 함께 보기 == |
== 함께 보기 == |
2014년 6월 4일 (수) 12:36 판
관련 문서 둘러보기 |
미적분학 |
---|
수학에서 헤세행렬(Hessian matrix)은 어떤 함수의 이계도함수를 행렬로 표현한 것이다. 헤세행렬은 독일의 수학자 루트비히 오토 헤세의 이름을 따서 명명되었다. 헤세행렬은 다변수함수가 극값을 가질 때, 그것이 극대인지, 극소인지 판정할 때 사용한다.
정의
실함수 이 주어졌을 때, 헤세행렬은 다음과 같이 주어진다.
헤세행렬은, 함수의 기울기 벡터 에 대한 야코비행렬로도 설명이 가능하다.
함수 의 이계도함수가 연속이라면 혼합 편미분은 같다. 그 때 이 행렬은 대칭행렬이다.
테일러급수와 헤세행렬
함수 의 인 테일러급수는 헤세행렬을 이용해서 나태낼 수 있다.
- 에 대해 (여기서 는 가 열벡터라고 할때 그 전치행렬인 행벡터를 의미한다.)
만약 가 임계점이라면 이므로 에 대해 이다. 즉, 상수가 아닌 가장 첫 번째 항이 바로 헤세행렬이 되는 셈이다.
함께 보기
- 야코비 행렬
- Weisstein, Eric Wolfgang. “Hessian”. 《Wolfram MathWorld》 (영어). Wolfram Research.
이 글은 수학에 관한 토막글입니다. 여러분의 지식으로 알차게 문서를 완성해 갑시다. |