工科数学分析-3.23

741 words

4 minutes

工科数学分析-3.23

2026-03-23

数学

5.4.3 有约束的极值 $Lagrange$ 乘数法#

1.一个约束条件#

二元函数 $z=f(x,y)$ ，目标函数， $g(x,y)=0$ 约束条件
设方程 $g(x,y)=0$ 确定的隐函数 $y=y(x),g_y(P_0)\neq 0,P_0(x_0,y_0)$
若极值点在点 $P_{0}(x_{0},y_{0})$ 取到，则 $z=f(x,y(x))$ 在 $x=x_{0}$ 取到极值，于是
$\frac{dz}{dx}=f_{x}+f_{y}\frac{dy}{dx}=0$
$\frac{d}{dx}g(x,y(x))=g_{x}+g_{y}\frac{dy}{dx}=0$
$\nabla f,\nabla g \perp(1,\frac{dy}{dx}=\vec{T}),\nabla f//\nabla g$
因此，存在常数 $\lambda_{0}$ ，使得 $\nabla f(P_{0})=\lambda_{0}\nabla g(P{0}),g(p_{0})=0(*2)$
引入变量 $\lambda$ 与函数 $L(x,y,\lambda)=f(x,y)-\lambda g(x,y)(*3)$
因为

\begin{align} L_{x}&=f_{x}-\lambda g_{x}\\ L_{y}&=f_{y}-\lambda g_{y}\\ L_{\lambda}&=-g \end{align}

所以 $(*2)$ 等价于 $\nabla L(P_0)=0(*4)$
若 $P_{0}(x_{0},y_{0})$ 为条件极值，则 $(x_{0},y_{0},\lambda_{0})$ 为 $L(x,y,\lambda)$ 的驻点，该方法称为拉格朗日乘数法
若约束集 $\{(x,y)|g(x,y)=0\}$ 是有限闭集，则条件极值存在
设 $g_{x},g_{y}$ 在 $D$ 上不全为零，求出拉格朗日函数 $(*3)$ 的全部驻点以及相应的函数值，再取最大或最小

ex.4 设 $x^{2}+xy+y^{2}=1$ ，求 $2x+3y$ 的最大值#

解
令 $L(x,y,\lambda)=2x+3y-\lambda(x^{2}+xy+y^{2}-1)$ ,由 $\nabla L=0$ ,得

\begin{align} L_{x}&=2-\lambda(2x+y)=0\\ L_{y}&=3-\lambda(x+2y)=0\\ L_{\lambda}&=-(x^{2}+xy+y^{2}-1)=0 \end{align}

$x=\frac{\pm 1}{\sqrt{21}},y=\frac{\pm 4}{\sqrt{21}},2x+3y=\pm\frac{14}{\sqrt{21}}$
三元函数， $u=f(x,y,z),g(x,y,z)=0$
若极值在点 $P_0(x_{0},y_{0},z_{0})$ 处取到，设 $g_{z}\neq0$ ，确定 $z=z(x,y),z_{0}=z(x_{0},y_{0})$
$g_{x}+g_{z}z_{x}=0,\nabla g\perp (1,0,z_{x})=\vec{v_{1}}$
$g_{y}+g_{y}z_{y}=0,\nabla g\perp(0,1,z_{y})=\vec{v_2}$
$\nabla g//\vec{v_1}\times\vec{v_2}=(-z_{x},-z_{y},1)=\vec{v_3}$
因为 $u=f(x,y,z(x,y))$ 在 $Q_{0}(x_{0},y_{0})$ 取极值，所以

\begin{align} u_{x}&=f_x+f_zz_x=0,\nabla f\perp \vec{v_1}\\ u_{y}&=f_y+f_zz_y=0,\nabla f\perp \vec{v_2}\\ \end{align}

说明 $\nabla f(p_{0})//\nabla g(P_{0})$
令 $L(x,y,z,\lambda)=f(x,y,z)-\lambda g(x,y,z)(6)$
则条件极值 $=>,\nabla L=0$ 即 $\nabla f-\lambda\nabla g=0,g=0$

例4.8 设 $x,y,z>0,xyz=v,u=xy+2yz+2yz$ ，求 $u_{min}$ #

解：
令 $L(x,y,z,\lambda)=xy+2yz+2xz-\lambda(xyz-v)$ ,由 $\nabla L=0$

\begin{align} L_{x}&=y+2z-\lambda(yz)=0\\ L_{y}&=x+2z-\lambda(xz)=0\\ L_{z}&=2y+2x-\lambda(xy)=0\\ L_{\lambda}&=-(xyz-v)=0 \end{align}

$z=\sqrt[3]{\frac{v}{4}},u=12z^{2}=12(\frac{v}{4})^{\frac{2}{3}}$

ex $x,y,z>0$ ,证明 $xyz\le(\frac{x+y+z}{3})^{3}$ #

证明:
$u=xyz,x+y+z=a>0$
令 $L(x,y,z,\lambda)=xyz-\lambda(x+y+z-a)$ ,由 $\nabla L=0$

\begin{align} L_{x}&=yz-\lambda =0\\ L_{y}&=zx-\lambda=0\\ L_{z}&=xy-\lambda=0\\ L_{\lambda}&=-(x+y+z-a)=0 \end{align}

$x=y=z=\frac{a}{3},u=(\frac{a}{3})^{3}$
约束集 $S=\{(x,y,z)|x+y+z=0,x,y,z\ge 0\}$
为 $\triangle ABC$ ，它是有界闭域 $u=xyz$ 在 $S$ 上连续，可取到最大值与最小值，在 $\partial S$ 上, $u=0$ ，
于是在大致在内部取到，因此最大值为 $(\frac{a}{3})^3$

2.两个约束条件#

$u=f(x,y,z),g(z,y,z)=0,h(x,y,z)=0(8)$
设方程组 $g(x,y,z)=0,h(x,y,z)=0(9)$
确定隐函数组 $x=x(z),y=y(z)(10)$
若 $u=f(x(z),y(z),z)$ 取极值，则

\begin{align} \frac{du}{dz}&=f_x\frac{dx}{dz}+f_{y}\frac{dy}{dz}+f_{z}=0\\ &=(f_x,f_y,f_z)\cdot(\frac{dx}{dz},\frac{dy}{dz},1), \nabla f\perp \vec{T} \end{align}

将 $x=x(z),y=y(z)$ 带入结束条件

g_x\frac{dx}{dz}+g_{y}\frac{dy}{dz}+g_{z}=0,\nabla g\perp \vec{T}

同理

h_x\frac{dx}{dz}+h_{y}\frac{dy}{dz}+h_{z}=0,\nabla h\perp \vec{T}

故存在 $\lambda,\mu$ ,使得
$\nabla f+\lambda\nabla g+\mu\nabla h=0$
令 $L(x,y,z,\lambda,\mu)=f(x,y,z)+\lambda g(x,y,z)+\mu h(x,y,z)$

ex.5 求 $u=x^{2}+y^{2}+z^{2}$ 在约束条件 $\frac{x^{2}}{4}+\frac{y^{2}}{5}+\frac{z^2}{25}=1,z=x+y$ 的极值#

解：
令 $L(x,y,z,\lambda,\mu)=x^{2}+y^{2}+z^{2}-\lambda(\frac{x^{2}}{4}+\frac{y^{2}}{5}+\frac{z^2}{25}-1)-\mu(x+y-z)$
由 $\nabla L=0$

\begin{align} L_{x}&=2x-\frac{1}{2}\lambda x-\mu=0&(1)\\ L_{y}&=2y-\frac{2}{5}\lambda y-\mu=0&(2)\\ L_{z}&=2z-\frac{2}{25}\lambda z+\mu=0&(3)\\ L_{\lambda}&=-(\frac{x^{2}}{4}+\frac{y^{2}}{5}+\frac{z^2}{25}-1)=0&(4)\\ L_{\mu}&=-(x+y-z)=0&(5)\\ \end{align}

$(1)\times x+(2)\times y+(3)\times z$ :
$2(x^{2}+y^{2}+z^{2})-\lambda(\frac{x^{2}}{2}+\frac{2y^{2}}{5}+\frac{2z^2}{25})-\mu(x+y-z0$
结合 $(4)(5)$ ， $x^{2}+y^2+z^2=\lambda$
由 $(1)(2)(3)$
$x=\frac{\mu}{2-\frac{1}{2}\lambda},y=\frac{\mu}{2-\frac{2}{5}\lambda},z=\frac{\mu}{2-\frac{2}{25}\lambda}$
带入 $(5)$ ,则 $\lambda=10,\frac{75}{17}$

Method 2#

把 $x,y,z,\mu$ 当做未知数， $\lambda$ 为系数，线性方程组有解

\begin{align} \begin{vmatrix} &2-\frac{1}{2}\lambda &0 &0 &-1 \\ &0 &2-\frac{2}{5}\lambda &0 &-1 \\ &0 &0 &2-\frac{2}{25}\lambda &1 \\ &1 &1 &-1 &0 \\ \end{vmatrix} &=(2-\frac{1}{2}\lambda)(2-\frac{2}{5}\lambda+2-\frac{2}{25}\lambda)-(-1)(2-\frac{2}{5}\lambda)(2-\frac{2}{25}\lambda)\\&=12-\frac{98}{25}\lambda+\frac{34}{125}\lambda^2 \end{align}

3.一般形式#

\begin{align} u&=f(X) &X=(x_1,x_2,...,x_n)\in R^n\\ \varphi_k(X)&=0 &1\le k\le m<n\\ \end{align}

$L(X,\lambda)=f(X)+\lambda_1\varphi_1(X)+...+\lambda_m\varphi_m(X),\lambda=(\lambda_1,...,\lambda_m)\in R^m$
由 $\nabla L=0$ ，求出全部驻点 $(X_0,\lambda_0)$
$X_0=(x_{0,1},x_{0,2},...,x_{0,n}),\lambda_0=(\lambda_{0,1},...,\lambda_{0,m})$
并要求 $rank(\frac{\partial\varphi_k}{\partial x_i})_{m\times n}=m$

\begin{align} \frac{\partial \varphi_{1}}{\partial x_{1}}d_{x_{1}}+...+\frac{\partial \varphi_{1}}{\partial x_{m}}d_{x_{m}}+\frac{\partial \varphi_{1}}{\partial x_{m+1}}d_{x_{m+1}}+...+\frac{\partial \varphi_{1}}{\partial x_{n}}d_{x_{n}}=0\\ ...\\ \frac{\partial \varphi_{m}}{\partial x_{1}}d_{x_{1}}+...+\frac{\partial \varphi_{m}}{\partial x_{m}}d_{x_{m}}+\frac{\partial \varphi_{m}}{\partial x_{m+1}}d_{x_{m+1}}+...+\frac{\partial \varphi_{m}}{\partial x_{n}}d_{x_{n}}=0\\ \end{align}

设 $\overline{X}=(x_{m+1},...,x_{n})$ 且优越数据确定的隐函数组
$x_{1}=x_{1}(\overline{X}),...,x_{m}=x_{m}(\overline {X})$

条件极值的充分条件#

对 $L$ 的每个驻点 $(X_{0},\lambda_{0})$
计算 $\Phi(X)=L(X,\lambda)$ 在点 $X_0$ 的 $Hesse$ 矩阵,

H(X_0)=\begin{pmatrix} \frac{\partial^2 L}{\partial x_i\partial y_j} \end{pmatrix}_{n\times n}

若 $H(X_0)$ 正（负）定在 $X_{0}$ 为条件极小（大）值点
证明：
注意到
$\nabla\Phi(X)=\nabla f(X)+\lambda_{0,1}\nabla\varphi_{1}(X)+...+\lambda_{0,m}\nabla\varphi_{m}(X),\nabla\Phi(X_{0})=0$
定义约束集 $S=\{X\in R^n|\varphi_{k}(X)=0,1\le k\le m\}$
在 $S$ 上 $f(X)=\Phi(X)$ ,设 $X,X+h\in S$ ,则

\begin{align} f(X+h)-f(X)&=\Phi(X+h)-\Phi(X)\\ &=\nabla \Phi(X)h+\frac{1}{2}h^{T}H(X)h+o(||h||^2)\\ &=\frac{1}{2}h^{T}H(X)h+o(||h||^2) \end{align}

当 $H(X_0)$ 正定时， $a=min_{||h||=1}h^{T}H(X_0)h>0$
此时 $h^TH(X_0)h\ge a||h||^2$ ,于是
$f(X_{0}+h)-f(X_{0})>||h||^2(\\frac{a}{2}+o(1))\ge 0$

ex.6 $g(x,y,z)=2x^{2}+y^2+z^2+2xy-2x-2y-4z+4=0$ 确定的隐函数 $z=z(x,y)$ 的极值#

解：

\begin{align} u&=f(x,y,z)=z,g(x,y,z)=0\\ L(x,y,z,\lambda)&=z+\lambda g(x,y,z),\nabla L=0\\ L_x&=\lambda(4x+2y-2)=0\\ L_y&=\lambda(2y+2x-2)=0\\ L_z&=1+\lambda(2z-4)=0\\ \end{align}

$x=0,y=0$ 则
$z_1=1,\lambda_1=\frac{1}{2}$ 或 $z_2=3,\lambda_2=-\frac{1}{2}$
$L_{xx}=4\lambda$
$L_{yy}=2\lambda$
$L_{zz}=2\lambda$
$L_{xy}=2\lambda$
$L_{xz}=0$
$L_{yz}=0$