Напомню прошлый семестр: говорят, что в точке $x_{0}$ достигается локальный максимум функции $f\left(x\right)$ (а сама точка называется точкой локального максимума), если вокруг неё существует такая окрестность радиуса $\varepsilon$, в точках которой (кроме своего центра $x_{0}$) функция достигает меньших значений, чем в $x_{0}$. Под окрестностью тогда понимался интервал $\left(x_{0}-\varepsilon;x_{0}+\varepsilon\right)$, а под точкой из окрестности - значение $x$: \[ \forall x\in\left(x_{0}-\varepsilon;x_{0}+\varepsilon\right)\quad\Rightarrow\quad f\left(x\right)\lt f\left(x_{0}\right). \] Аналогично определялся минимум (точка минимума), за той разницей, что на этот раз функция принимала в точке $x_{0}$ минимальное, а не максимальное значение среди точек её окрестности ($f\left(x\right)>f\left(x_{0}\right)$). Максимумы и минимумы собирательно назывались экстремумами.
Напомню и как экстремумы находились. Сначала рассматривались необходимые условия экстремума: если в точке достигается экстремум (любой) и функция в этой точке дифференцируема, то её производная в ней равна нулю. Значит, если уравнение $f'\left(x\right)=0$ не выполняется где-либо, то там не достигается экстремум. Из уравнения $f'\left(x_{k}\right)=0$ находились такие точки, в которых экстремум в принципе может быть достигнут, и дальше этот список исследовался при помощи достаточных условий экстремума. Одним из этих условий был знак второй производной: если $f\left(x_{k}\right)<0$ - в точке $x_{k}$ достигается максимум, если же $f\left(x_{k}\right)>0$ - то минимум.
Определения и алгоритмы нахождения максимумов для функций многих переменных во многом повторяют вышеописанное, но со своими деталями. Так как множество аргументов $\left(x_{1}\dots x_{n}\right)$ рассматриваемой функции задаёт точку не на числовой оси, а в пространстве с размерностью $n$, нужно переопределить, что значит «окрестность»: теперь $\varepsilon$-окрестностью точки $A\left(x_{1}^{0}\dots x_{n}^{0}\right)$ называется множество точек $B\left(x_{1}\dots x_{n}\right)$ с такими координатами, что расстояние между точками $A$ и $B$ меньше $\varepsilon$: \[ \left(x_{1}-x_{1}^{0}\right)^{2}+\dots+\left(x_{n}-x_{n}^{0}\right)^{2}<\varepsilon^{2} \] Есть и другое определение окрестности, по которому должна выполняться система неравенств: \[ \left\{ \begin{array}{c} \left|x_{1}-x_{1}^{0}\right|<\varepsilon,\\ \cdots\cdots\cdots\cdots\cdots\cdots\\ \left|x_{n}-x_{n}^{0}\right|<\varepsilon. \end{array}\right. \] На примере плоскости нетрудно увидеть, что первое определение задаёт круг, а второе - описаный вокруг него квадрат (шар и куб в трёхмерном пространстве). Доказывается, что эти определения эквивалентны с точки зрения дальнейших рассуждений: если вокруг некоторой точки существует «квадратная» окрестность, во всех точках которой выполняется некоторое условие, то вокруг неё существует и «круглая» окрестность с такими же свойствами; и наоборот.
В остальном же определение экстремума звучит так же: точка $A$ называется точкой локального максимума (минимума) функции $f\left(A\right)$, если вокруг неё существует такая окрестность радиуса $\varepsilon$, в точках которой, за исключением центра $A$, функция достигает меньших (больших) значений, чем в $A$.
По прежнему и алгоритм нахождения экстремума состоит из двух частей:
1) Рассмотрение необходимых условий и выделение из пространства точек, подозрительных на экстремум.
На этот раз необходимое условие записывается проще всего через дифференциал (вдруг обнаружившиеся на заменах фанатичные сторонники дифференциалов могут ликовать): \[ df=0. \] Как известно, $df=f_{x_{1}}'dx_{1}+\dots+f_{x_{n}}'dx_{n}$; условие выше должно выполняться при любых значениях $dx_{1},\dots dx_{n}$, что означает, что все производные должны быть равны нулю: \begin{equation} \left\{ \begin{array}{c} f_{x_{1}}'\left(x_{1}\dots x_{n}\right)=0,\\ \dots\dots\dots\dots\dots\dots\dots\dots\dots\\ f_{x_{n}}'\left(x_{1}\dots x_{n}\right)=0. \end{array}\right.\label{neob} \end{equation} В точках, находимых из этой системы (они называются стационарными), экстремум в принципе может достигаться (а может и нет); в остальных точках - точно не может.
2) Проверка достаточных условий в стационарных точках.
Тут следует понимать, что если проверяемое нами достаточное условие выполняется - в точке есть экстремум, но если не выполняется - то мы просто ничего не можем сказать. Возможно, экстремума нет, или он есть, но его нужно доказывать другими методами. Самое часто применяемое, самое рабочее достаточное условие максимума: \[ d^{2}f<0, \] и родственное ему условие минимума: \[ d^{2}f>0. \] Выглядит очень похоже на случай функции одной переменной, но есть существенная деталь: там речь шла об одном значении. Второй же дифференциал, как и первый (см. выше) зависит от $n$ приращений координат $dx_{k}$ (помимо $n$ самих координат $x_{k}$). В качестве координат в него подставляются координаты исследуемой точки, но набор приращений остаётся свободным. И второй дифференциал должен иметь определённый знак при любом выборе их значений, кроме одновременно нулевых. Отсюда появляется ещё одна возможность, непохожая на то, что мы видели раньше, используемая в признаке ниже: если при разных значениях $dx_{k}$ знак $d^{2}f$ может быть разным, то в рассматриваемой точке нет экстремума.
Выражаясь строго математически, нужно сказать, что второй дифференциал представляет собой квадратичную форму от вектора смещения, и нам нужно выяснить вопрос её знакоопределённости. Но так как полная теоретическая база для этого ещё только начитывается первому курсу в этом семестре, постараемся обойтись простыми и понятными методами, например, методом Лагранжа.
В качестве примера рассмотрим № 3643 из Демидовича: найти экстремумы функции \[ u\left(x,u,z\right)=x^{3}+y^{2}+z^{2}+12xy+2z \] Из (\ref{neob}) \[ \left\{ \begin{array}{c} u_{x}'=3x^{2}+12y=0\\ u_{y}'=12x+2y=0\\ u_{z}'=2z+2=0 \end{array}\right. \] Из третьего уравнения системы $z=-1$, из второго $y=-6x$; подставляя в первое, получим \[ 3x^{2}-6\cdot12x=0 \] \[ x\left(x-24\right)=0 \] \[ x_{1}=0,\qquad x_{2}=24 \] \[ y_{1}=0,\qquad y_{2}=-144 \] Получаем две точки: $A\left(0,0,-1\right)$ и $B\left(24,-144,-1\right)$.
Для проверки достаточных условий найдём $d^{2}u$: \[ du=\left(3x^{2}+12y\right)dx+\left(12x+2y\right)dy+\left(2z+2\right)dz \] \[ d^{2}u=\left(6xdx+12dy\right)dx+\left(12dx+2dy\right)dy+\left(2dz\right)dz= \] \[ =6x\left(dx\right)^{2}+24dxdy+2\left(dy\right)^{2}+2\left(dz\right)^{2} \] Чтобы проверить конкретную точку, нужно подставить в $d^{2}u$ её координаты. Чтобы проверить знакоопределённость, требуется выделить полные квадраты, каждый из которых содержит некоторую координату полностью. \[ \left.d^{2}u\right|_{A}=24dxdy+2\left(dy\right)^{2}+2\left(dz\right)^{2}=2\left(\left(dy\right)^{2}+2\cdot6dxdy+\left(6dx\right)^{2}-\left(6dx\right)^{2}\right)+2\left(dz\right)^{2}= \] \[ =2\left(dy+6dx\right)^{2}-72\left(dx\right)^{2}+2\left(dz\right)^{2} \] Подставим $dx=0$, $dy=1$ и $dz=0$, тогда $\left.d^{2}u\right|_{A}=2>0$. Но если $dx=1$, $dy=-6$ и $dz=0$, то $\left.d^{2}u\right|_{A}=-72<0$. Второй дифференциал не является знакоопределённым в точке $A$, значит, в точке $A$ экстремума нет; двигаясь из точки $A$ в одних направлениях, можно увидеть возрастание, в других - убывание функции $f$.
Рассмотрим точку $B\left(24,-144,-1\right)$, в которой также может достигаться экстремум. \[ \left.d^{2}u\right|_{B}=6\cdot24\left(dx\right)^{2}+24dxdy+2\left(dy\right)^{2}+2\left(dz\right)^{2}=\left(12dx\right)^{2}+2\cdot12dxdy+\left(dy\right)^{2}+\left(dy\right)^{2}+2\left(dz\right)^{2}= \] \[ =\left(12dx+dy\right)^{2}+\left(dy\right)^{2}+2\left(dz\right)^{2}>0, \] что явно выполняется при любых $dx$, $dy$ и $dz$, если только все они не равны нулю одновременно. Значит, в точке $B$ достигается минимум, и двигаясь из точки $B$ в любом направлении, мы увидим возрастание функции $f$.
Есть ещё один промежуточный случай, не рассмотренный выше. Экстремумы, определённые выше при помощи строгих неравенств, можно назвать строгими. Но возможна ситуация, при которой вокруг точки $A$ нет окрестности, в которой исследуемая функция принимает всюду меньшие значения чем в $A$ (т.е. в точке $A$ не достигается строгий максимум), но есть окрестность, в которой функция принимает всюду меньшие или равные значения, чем в $A$. В таком случае точка $A$ называется точкой нестрогого максимума.
Наглядно можно представить строгий максимум как вершину холма: куда бы вы не пошли с неё, вы пойдёте вниз. Нестрогий же максимум подобен вершине железнодорожной насыпи или дамбы: сойдя с этой точки почти в любом направлении, вы пойдёте вниз, но есть направление, пойдя в котором, вы останетесь на той же высоте. В отличие от строгих максимумов, представляющих собой изолированные точки, нестрогие могут образовывать протяжённые объекты, например, кривые.
Сказанное для максимумов очевидным образом переносится на минимумы. Если строгий минимум (функции двух переменных, конечно) можно представить в виде дна ямы, то нестрогий минимум - в виде дна канавы.
Появляется нестрогий экстремум, например, в № 3623:
начнём с необходимых условий \[ z\left(x,y\right)=\left(x-y+1\right)^{2} \] \[ dz=2\left(x-y+1\right)\left(dx-dy\right) \] \[ dz=0,\qquad\Rightarrow\qquad x-y+1=0 \] \[ y=x+1 \] Решения, на которых могут достигаться экстремумы, образуют прямую. Посмотрим, что будет со вторым дифференциалом: \[ d^{2}z=2\left(dx-dy\right)\left(dx-dy\right)=2\left(dx-dy\right)^{2} \] Отрицательным такой $d^{2}z$, конечно, не бывает. Но и положителен он не всегда: можно подобрать $dx=-dy\neq0$, что $d^{2}z=0$. В этих точках достигается нестрогий минимум: вокруг них значение $z$ больше или равно, чем в них.
Решить самим: № 3621, 3622, 3624, 3633, 3644, 3646.
Для находчивых: № 3651 - 3653.
Условные экстремумы находятся для функции $f\left(x_{1},\dots,x_{n}\right)$, заданной в некотором многомерном пространстве, но не на всех его точках, а на их подмножестве, выделенном одним или несколькими уравнениями связи \begin{equation} \left\{ \begin{array}{c} \varphi_{1}\left(x_{1},\dots,x_{n}\right)=0,\\ \dots\dots\dots\dots\dots\dots\dots\dots\\ \varphi_{m}\left(x_{1},\dots,x_{n}\right)=0. \end{array}\right.\label{sv} \end{equation}
Под экстремумом на подмножестве понимается такая точка этого подмножества, вокруг которой существует такая окрестность, в точках которой, принадлежащих подмножеству, функция $f\left(x_{1},\dots,x_{n}\right)$ достигает экстремального (максимального или минимального) значения.
Например, в задаче №3655 (см. рис. 2) функция $z\left(x,y\right)$ задаёт в плоскость в пространстве, и на всём пространстве явно не имеет экстремумов. Но среди точек окружности $x^{2}+y^{2}=1$ функция $z\left(x,y\right)$ достигает максимума в точке $C$, поскольку нигде в точках этой окружности не принимает большего значения; тем более, вокруг точки можно построить окрестность (любого размера), в которой все значения функции $z\left(x,y\right)$ будут меньше. Аналогично, функция $z\left(x,y\right)$ достигает минимума в точке $D$.
К сожалению, условные экстремумы не являются выдумкой аутистов, которым было нечего делать. Та же логика, которая используется для их нахождения, применяется в вариационном исчислении (будет изучаться через год), а то применяется в теоретической механике, каковая является основой для теоретической физики вообще. Вам будет гораздо удобнее потом, если вы освоите это понятие сейчас.
Находятся условные экстремумы разными способами. Самое простое (но не всегда возможное) - это решить систему (\ref{sv}) относительно $m$ координат, выразить их через оставшиеся, подставить в функцию $f$, и уже её исследовать на экстремум в $n-m$-мерном пространстве. Но более универсальным способом считается такой:
1) Составим функцию Лагранжа \[ L=f+\lambda_{1}\varphi_{1}+\dots+\lambda_{m}\varphi_{m}, \] и считая $\lambda_{1},\dots,\lambda_{m}$ дополнительными координатами, найдём стационарные точки функции $f$ в $n+m$-мерном пространстве. Взяв от них координаты $x$, получим стационарные точки в $n$-мерном пространстве, в которых достижим экстремум (звучит как шаманство, но этот метод имеет свои обоснования).
2) В этих точках проверим на знакоопределённость второй дифференциал функции $f$, но не при произвольных приращениях координат - а только при таких, которые не выводят за пределы изучаемого множества точек. Если на множестве соблюдаются уравнения (\ref{sv}), то приращения будут связаны так: \begin{equation} \left\{ \begin{array}{c} \frac{\partial\varphi_{1}}{\partial x_{1}}dx_{1}+\dots+\frac{\partial\varphi_{1}}{\partial x_{n}}dx_{n}=0,\\ \dots\dots\dots\dots\dots\dots\dots\dots\\ \frac{\partial\varphi_{m}}{\partial x_{1}}dx_{1}+\dots+\frac{\partial\varphi_{m}}{\partial x_{n}}dx_{n}=0. \end{array}\right.\label{dsv} \end{equation} $d^{2}f$ же строится так: находится $df$, в него подставляются $m$ приращений $dx$, выраженных из (\ref{dsv}), затем находится дифференциал от полученного, и в него снова подставляются вышеупомянутые $m$ приращений; полученное исследуется на знакоопределённость.
Как это делается - показано на примере №3655 в этом давнем посте.
Решите самостоятельно: № 3656, 3659, 3662.