극값

위키백과, 우리 모두의 백과사전.
이동: 둘러보기, 검색
함수f(x) = cos(3πx)/x, 0.1≤x≤1.1에서의 극값. 일부 극값은 최대/최솟값이기도 하다.

함수극값은 특정 지점의 함수값이 그 지점 주변의 다른 모든 함수값과 비교했을 때 가장 크거나 가장 작은 경우의 값을 가리킨다. 그 함수값이 가장 큰 경우를 극대값, 가장 작은 경우를 극소값으로 부른다.

최적화 문제에서는 함수의 극값이나 최대/최솟값을 구하는 문제를 다룬다.

정의[편집]

일반적인 함수 f의 그래프

공역부분순서가 존재하는 함수 f(x)에 대해, 어떤 값 x^*근방 U가 존재하여 그 근방에 속하는 모든 x에 대해 f(x^*) \ge f(x)가 성립하는 경우, 그 함수는 x^*에서 극대가 된다고 정의한다. 이때 f(x^*)극대값으로 정의한다. 반대로, f(x^*) \le f(x)가 성립하는 경우는 극소, 극소값으로 정의한다.

만약 x^*가 함수 f정의역의 모든 원소의 함숫값 이상이거나 이하일 경우, x^*에서 최대 혹은 최소가 된다고 정의한다. 이 때의 극값을 최댓값, 최솟값으로 부른다.

최댓값과 극대값, 최솟값과 극소값은 전혀 관계가 없다. 최댓값이면서 극대값이 아닐수도 있고 최솟값이면 극소값이 아닐 수도 있다. 다음은 f:\left[ a,b\right]\sub\mathbb{R}\to\mathbb{R}의 그래프이다. 이 함수는 점 A에서 최소이고 점 J에서 최대이다. 또한 점 B, D, F, J에서 극대이고 점 E, G에서 극소이다. 즉, 점 J와 같이 극대이며 최대일수도 있지만 점 A와 같이 최소이면서 극소가 아닐 수도 있다.

일계도함수판정법[편집]

공역부분순서가 존재하는 모든 함수가 극대, 극소를 판정할 수 있지만 여기서는 편의상 공역실수집합 \mathbb{R}인 함수 f:U\sub\mathbb{R}^n\to\mathbb{R}를 생각하자.(여기서 U는 열린집합이다.) 만약 이 함수가 미분가능하고 \mathbf{x}_0에서 극값을 가진다면 \mathbf{D}f\left(\mathbf{x}_0\right) =\mathbf{0}이다. 즉, \mathbf{x}_0는 함수 f임계점이다. 이렇게 임계점을 통해 극값을 찾는 방법을 일계도함수판정법이라고 한다. 이때 미분 계수가 0이기 위해서는 1부터 n까지의 모든 i에대해 \frac{\partial f}{\partial x_i}=0임을 알 수 있다. 주의할 점은 극값을 가지기 위해서는 임계점이여야하지만 임계점이라고 모두 극값을 가지는 것은 아니라는 점이다. 예를 들어 위 그래프의 점 I나 점 K의 경우 임계점이긴 하지만 극소나 극대값은 아니다.

증명[편집]

n=1일 때

극대값의 정의에 의하여 x\in I\Rightarrow f\left( x\right)\le f\left( x_0\right)를 만족하는 x_0를 포함하는 어떤 개구간 I가 존재한다. 개구간열린 집합이므로 \left( x_0-\delta_1,x_0+\delta_1\right)\in I를 만족하는 어떤 양의 실수 \delta_1이 존재한다. f'\left( x_0\right)가 존재하므로 이를 K라하자. 그렇다면 \lim_{h\to 0}\frac{f\left( x_0+h\right) -f\left( x_0\right)}{h}=\lim_{h\to 0^+}\frac{f\left( x_0+h\right) -f\left( x_0\right)}{h}=\lim_{h\to 0^-}\frac{f\left( x_0+h\right) -f\left( x_0\right)}{h}=K이다. 0<h<\delta_1일 때 \frac{f\left( x_0+h\right) -f\left( x_0\right)}{h}>0이므로 \lim_{h\to 0^+}\frac{f\left( x_0+h\right) -f\left( x_0\right)}{h}=K\ge 0이다.(극한의 성질 중 함수와 극한의 대소 문단 참고) 마찬가지로 -\delta_1<h<0일 때 \frac{f\left( x_0+h\right) -f\left( x_0\right)}{h}<0이므로 \lim_{h\to 0^-}\frac{f\left( x_0+h\right) -f\left( x_0\right)}{h}=K\le 0이다. K\ge 0인 동시에K\le 0이므로 K=0이다. 극솟값의 경우도 마찬가지이다. 즉, 함수 f가 미분가능하고 x_0에서 극값을 가진다면 f'\left( x_0\right) =0이다.

모든 n에 대해

임의의 벡터 \mathbf{h}\in\mathbb{R}^n에 대해 함수 g:U'\sub\mathbb{R}\to\mathbb{R}g\left( t\right) =f\left(\mathbf{x}_0+t\mathbf{h}\right)로 정의하자. 그렇다면 gt=0에서 극값을 가져야 한다. 위에서 증명했듯이 g'(0)=0이므로 연쇄법칙에 의하여 \mathbf{D}f\left(\mathbf{x}_0\right)\mathbf{h}=0이다. 임의의 \mathbf{h}에 대해 0이므로 \mathbf{D}f\left(\mathbf{x}_0\right) =0이다.

이계도함수판정법[편집]

함수 f:U\sub\mathbb{R}^n\to\mathbb{R}C^3 함수이고 \mathbf{x}_0\in U가 함수 f임계점일때, \mathbf{h}^TH\left( f\right)\left(\mathbf{x}_0\right)\mathbf{h}양의 정부호이면, 즉 모든 \mathbf{h}\in\mathbb{R}^n에 대하여 0 이상이고 \mathbf{h}=\mathbf{0}일때만 0이라면 \mathbf{x}_0에서 극소이다. 반대로 \mathbf{h}^TH\left( f\right)\left(\mathbf{x}_0\right)\mathbf{h}음의 정부호이면, 즉 모든 \mathbf{h}\in\mathbb{R}^n에 대하여 0 이하이고 \mathbf{h}=\mathbf{0}일때만 0이라면 \mathbf{x}_0에서 극대이다. 이를 이용하여 극대, 극소를 판별하는 방법을 이계도함수판정법이라고 한다.

여기서 n=1이라는 조금 특별하고 조금 더 익숙한 경우를 생각해보자. n=1이라면 \mathbf{h}^TH\left( f\right)\left(\mathbf{x}_0\right)\mathbf{h}=\frac{1}{2}f''\left( x_0\right) h^2이므로 f''\left( x_0\right) >0일때만 양의 정부호이고 f''\left( x_0\right) <0일때만 음의 정부호이다. 즉, 일변수 함수의 이차도함수판정법은 단순히 f''\left( x_0\right)의 부호를 알아보는 것이다.

증명[편집]

보조정리: 어떤 n\times n 실수행렬 B=\left[ b_{ij}\right]가 있을 때 이차함수 H:\mathbb{R}^n\to\mathbb{R},\left( h_1,\dots h_n\right)\mapsto\frac{1}{2}\sum_{i,j=1}^nb_{ij}h_ih_j를 정의하자. 만약 H양의 정부호라면 모든 \mathbf{h}\in\mathbb{R}^nH\left(\mathbf{h}\right)\ge M\left\Vert\mathbf{h}\right \|^2을 만족하는 양의 실수 M이 존재한다.

(증명) \left\Vert\mathbf{x}\right\| =1\mathbf{x}에 대해 H\left(\mathbf{x}\right)연속이므로 최대·최소 정리에 의하여 최솟값 M을 가진다. 이때 H양의 정부호이므로 M>0이다.
 H이차함수이므로 \mathbf{0}이 아닌 모든 \mathbf{h}에 대해 H\left(\mathbf{h}\right) =H\left(\frac{\mathbf{h}}{\left\Vert\mathbf{h}\right\|}\left\Vert\mathbf{h}\right\|\right) =H\left(\frac{\mathbf{h}}{\left\Vert\mathbf{h}\right\|}\right)\left\Vert\mathbf{h}\right\|^2\ge M\left\Vert\mathbf{h}\right\|^2가 성립한다. \mathbf{h}=\mathbf{0}일때는 자명하다.

\mathbf{D}f\left(\mathbf{x}_0\right) =\mathbf{0}이므로 테일러 정리에 의하여 f\left(\mathbf{x}_0+\mathbf{h}\right) -f\left(\mathbf{x}_0\right) =\mathbf{h}^TH\left( f\right)\left(\mathbf{x}_0\right)\mathbf{h}+R_2\left(\mathbf{x}_0,\mathbf{h}\right)이다. 여기서 \lim_{\mathbf{h}\to\mathbf{0}}\frac{R_2\left(\mathbf{x}_0,\mathbf{h}\right)}{\left\Vert\mathbf{h}\right\|^2}=0이다. 만약 \mathbf{h}^TH\left( f\right)\left(\mathbf{x}_0\right)\mathbf{h}양의 정부호라면 보조 정리에 의하여 \mathbf{h}^TH\left( f\right)\left(\mathbf{x}_0\right)\mathbf{h}\ge M\left\Vert\mathbf{h}\right\|^2를 만족하는 양의 실수 M이 존재하며 극한의 정의에 의하여 0<\left\Vert\mathbf{h}\right\| <\delta\Rightarrow\| R_2\left(\mathbf{x}_0,\mathbf{h}\right)\| <M\left\Vert\mathbf{h}\right\|^2을 만족하는 양의 실수 \delta가 존재한다. 따라서 0<\left\Vert\mathbf{h}\right\| <\delta일 때 f\left(\mathbf{x}_0+\mathbf{h}\right) -f\left(\mathbf{x}_0\right) =\mathbf{h}^TH\left( f\right)\left(\mathbf{x}_0\right)\mathbf{h}+R_2\left(\mathbf{x}_0,\mathbf{h}\right) >0, 즉 f\left(\mathbf{x}_0+\mathbf{h}\right) >f\left(\mathbf{x}_0\right)이다. 그러므로 \mathbf{x}_0에서 극소이다. 비슷한 방식으로 \mathbf{h}^TH\left( f\right)\left(\mathbf{x}_0\right)\mathbf{h}음의 정부호이면 \mathbf{x}_0에서 극대이다.

헤시안 행렬식과의 관계[편집]

그림과 같은 대각선상에 위치한 부분행렬들의 행렬식들이 이차도함수판정법에 이용된다.

헤시안 행렬에서 그림과 같이 대각선상에 위치한 부분행렬들의 행렬식들이 모두 양일 경우 \mathbf{h}^TH\left( f\right)\left(\mathbf{x}_0\right)\mathbf{h}양의 정부호이고 음과 양이 번갈아서 나올 경우 음의 정부호이다. 즉, 이차도함수판정법에 따라서 부분행렬들의 행렬식들이 모두 양일 경우 \mathbf{x}_0에서 극소이고 부분행렬들의 행렬식이 음과 양이 반복될 경우 \mathbf{x}_0에서 극대이다. 만약 두 경우 모두 아니라면 임계점 \mathbf{x}_0안장점으로 극대이지도 극소이지도 않다.

예를들어, 이변수함수 f\left( x,y\right) :U\sub\mathbb{R}^2\to\mathbb{R}이고 C^3함수일 경우 만약 \left( x_0,y_0\right)에서 극소라면 다음과 같은 조건들을 만족한다.

  1. \frac{\partial f}{\partial x}\left( x_0,y_0\right) =\frac{\partial f}{\partial y}\left( x_0,y_0\right) =0
  2. \frac{\partial^2f}{\partial x^2}\left( x_0,y_0\right) >0
  3. \left( x_0,y_0\right)에서 D=\left(\frac{\partial^2f}{\partial x^2}\right)\left(\frac{\partial^2f}{\partial y^2}\right) -\left(\frac{\partial^2f}{\partial x\partial y}\right)^2>0 이때 Df헤시안 행렬행렬식이다.

마찬가지로 \left( x_0,y_0\right)에서 극대라면 다음과 같은 조건들을 만족한다.

  1. \frac{\partial f}{\partial x}\left( x_0,y_0\right) =\frac{\partial f}{\partial y}\left( x_0,y_0\right) =0
  2. \frac{\partial^2f}{\partial x^2}\left( x_0,y_0\right) <0
  3. \left( x_0,y_0\right)에서 D>0

그리고 \left( x_0,y_0\right)가 이 조건들을 만족하지 않는 임계점이라면, 즉, \left( x_0,y_0\right)에서 D<0라면 \left( x_0,y_0\right)안장점이다.

만약 D=0이라면 이차도함수판정법만으로는 극대와 극소를 판별할 수 없는데, 이때 D=0임계점을 퇴화극점 또는 변질극점이라고 말한다. 반대로 이차도함수판정법으로 극대, 극소, 안장점인지의 여부를 판별할 수 있는 D\ne 0임계점을 정상적인 임계점 또는 비퇴화 임계점이라고 일컫는다.

같이 보기[편집]

참고 문헌[편집]

  • James Stewart (2009). 《Calculus(Metric International Version, 6th Edition)》. Brooks/Cole, Cengage Learning. ISBN 0-495-38362-7
  • Jerrold E. Marsden, Anthony J. Tromba (2003). 《Vector Calculus(Fifth Edition)》. W. H. Freeman and Company. ISBN 0-7167-4992-0