设 u=f(x) 在区域 D 上有定义,x0∈D,v=(cosθ1,cosθ2,…,cosθn) 为一方向,如果极限 limt→0+0tf(x0+tv)−f(x0) 存在,则称为 f(x) 在 x0 处沿 v 的方向导数,记为 ∂v∂f(x0)。
一个二元函数在 (x0,y0) 处的所有方向导数都存在也未必连续,例如 f(x,y)=[y=x2,x=0] 在 (0,0) 处。
记 Δx=(Δx1,Δx2,⋯,Δxn),并称它为自变量的全增量。若存在仅依赖于 x0 的常数 Ai,使得 Δf(x0)=f(x0+Δx)−f(x0)=∑i=1nAiΔxi+o(∣Δx∣),则称 f(x) 在 x0 处可微,并称 ∑i=1nAiΔxi 为全微分,记为 df(x0)。
可微一定连续,且必然有 df(x0)=∑i=1n∂xi∂f(x0)dxi。
定理:如果 f(x) 在 U(x0,δ0) 存在各个偏导数,并且这些偏导数在 x0 处连续,即 f(x)∈C1(D),则 f(x) 在 x0 处可微。
对 n 归纳。n=k 成立,当 n=k+1 时,由一元函数拉格朗日中值定理,f(x0+Δx)−f(x10+Δx1,⋯,xk0+Δxk,xk+10)=∂xk+1∂f(x0)Δxk+1+o(1)∣Δxk+1∣。
根据归纳假设,f(x10+Δx1,⋯,xk0+Δxk,xk+10)−f(x0)=∑i=1k∂xi∂f(x0)Δxi+o(1)∑i=1k(∣Δxi∣)2。相加得到 Δf(x0)=∑i=1k+1∂xi∂f(x0)Δxi+o(1)∑i=1k+1(∣Δxi∣)2。
定理:如果 f(x0) 可微,对于 v=(cosθ1,⋯,cosθn),它的方向导数为 ∂v∂f(x0)=∑i=1n∂xi∂f(x0)cosθi。
从上式看出,可微函数的方向导数最大的方向向量为 ∑i=1n(∂xi∂f(x0))21(∂x1∂f(x0),∂x2∂f(x0),⋯,∂xn∂f(x0)),同时它的模就是方向导数的值。称 (∂x1∂f(x0),∂x2∂f(x0),⋯,∂xn∂f(x0)) 为 x0 处的梯度,记为 gradf(x0)。所以 ∂v∂f(x0)=gradf(x0)⋅v。
后文所有向量默认为列向量
设向量函数 f(x)=(f1(x),f2(x),⋯,fm(x))T 在区域 D 上有定义,Δx=(Δx1,Δx2,⋯,Δxn)T 为 x 在 x0 处的全增量,如果存在只与 x0 有关的 m×n 矩阵 A 使得 ∣Δx∣→0 时,Δf(x0)=(Δf1(x0),Δf2(x0),⋯,Δfm(x0))T=AΔx+α(∣Δx∣),其中 α(∣Δx∣)=(α1(∣Δx∣),α2(∣Δx∣),⋯,αm(∣Δx∣))T,αj 依赖 Δx 且 lim∣Δx∣→0∣Δx∣αj(∣Δx∣)=0,则称 f(x) 在 x0 处可导/可微。A 称为 Frechet 导数,记作 f′(x0) 或者 Df(x0);AΔx 称为全微分,记作 df(x0),即 df(x0)=Df(x0)Δx。
定理:向量函数可微的充要条件是它包含的所有函数可微,此时 f′(x0)=∂x1∂f1(x0)∂x1∂f2(x0)⋮∂x1∂fm(x0)∂x2∂f1(x0)∂x2∂f2(x0)∂x2∂fm(x0)⋯⋯⋯∂xn∂f1(x0)∂xn∂f2(x0)∂xn∂fm(x0) 称为雅可比 Jacobi 矩阵,记为 Jf(x0),特别的,如果是方阵,那么它的行列式称为雅可比行列式,记作 ∂(x1,x2,⋯,xn)∂(f1,f2,⋯,fn)x0
如果 fj(x) 的各个偏导数在区域 D 上连续,我们称 f(x) 在 D 上是 C1 的,记作 f(x)∈C1(D)。特别的,如果区域 D 到 Ω 的变换 f(x)∈C1(D) 及 f−1∈C1(Ω),则说这个变换是 C1 的。
如果 f(x):Rn→R,g(x):Rn→Rm 列向量函数,则 (f(x)g(x))′=f(x)g′(x)+g(x)f′(x)。
(f(x)g(x))′(i;j)=∂xj∂(f(x)gi(x))=f(x)∂xj∂gi(x)+gi(x)∂xj∂f(x)=f(x)g′(x)(i;j)+g(x)f′(x)(i;j)
f(u) 在 u0 处可微,u0=u(x0) 在 x0 处可微,则 f(u(x)) 在 x0 处可微,且 f′(u(x0))=f′(u0)u′(x0)。
Δf(u(x))=f′(u0)Δu(x)+β(∣Δu(x)∣)=f′(u0)(u′(x0)Δx+α(∣Δx∣))+β(∣Δu(x)∣)
下面说明 lim∣Δx→0∣∣Δx∣f′(u0)α(∣Δx∣)+β(∣u′(x0)Δx+α(∣Δx∣)∣)=0 即可。前一半是显然的,后一半由于 ∣u′(x0)Δx+α(∣Δx∣)∣≤∣∣u′(x0)∣∣∣Δx∣+∣Δx∣≤∣Δx∣(∣∣u′(x0)∣∣+1)→0,故同样也是 0。
推论:f,u 均可微,df(u(x))=f′(u(x))u′(x)dx。
推论:y=f(x) 是 D 到 Ω 的 C1 变换,则 (f−1)′(y)=[f′(x)]−1,从而 ∂(x1,x2,⋯,xn)∂(y1,y2,⋯,yn)⋅∂(y1,y2,⋯,yn)∂(x1,x2,⋯,xn)=1。
推论(链锁法则):f(u) 在 u0 处可微,u(x)=(u1(x),u2(x),⋯,um(x))T 在 x0 处可微(可以减弱为存在各个偏导数),u0=u(x0),则 ∂xi∂f(u(x0))=∑j=1m(∂uj∂f(u0)⋅∂xi∂uj(x0))。
当 ∂xk∂(∂xi∂f(x)) 存在时,可以将其记为 ∂xk∂xi∂2f(x) 或 fxkxi′′(x)。
定理:对于 j,k,如果 fjk′′(x) 与 fkj′′(x) 在 U(x0,δ) 内存在,且在 x0 处连续,则 fjk′′(x0)=fjk′′(x0)。
考虑 I=ΔxΔyf(x0+Δx,y0+Δy)−f(x0+Δx,y0)−f(x0,y0+Δy)+f(x0,y0),一方面,I=Δyfx′(x0+θΔx,y0+Δy)−fx′(x0+θΔx,y0)=fyx′(x0+θΔx,y0+μΔy),另一方面可以写作 fxy′(x0+θ′Δx,y0+μ′Δy),由连续性得到相等。
对于高阶微分可以形式化的记 dkf(x)=(∑i=1ndxi∂xi∂)kf(x)。
特别的,对于二元函数 f(x,y),dkf(x,y)=∑j=0kCkj∂xk−j∂yj∂kf(x,y)dxk−jdyj。
定理(拉格朗日余项泰勒公式):设函数 f(x) 在 U(x0,δ0) 内具有连续 K+1 阶偏导数,则 ∀x0+h∈U(x0,δ0),存在 0<θ<1,f(x0+h)=f(x0)+k=1∑Kk!1(i=1∑nhi∂xi∂)kf(x0)+(K+1)!1(i=1∑nhi∂xi∂)K+1f(x0+θh)
构造 φ(t)=f(x0+th),则 φ(t) 有 K+1 阶连续导数,使用一元函数泰勒公式即可证明。
推论(皮亚诺余项泰勒公式):f(x)∈CK(U(x0,δ0)),则 f(x0+h)=f(x0)+k=1∑Kk!1(i=1∑nhi∂xi∂)kf(x0)+o(∣h∣K)
推论(拉格朗日微分中值定理):f(x)∈C1(D),则 ∀t∈[0,1],x0+t(x−x0)∈D,有 f(x)−f(x0)=i=1∑n∂xi∂f(x0+θ(x−x0))(xi−xi0)=f′(x0+θ(x−x0))(x−x0)
海色 Hessi 矩阵:Hf(x0)=∂x12∂2f(x0)∂x2∂x1∂2f(x0)⋮∂xn∂x1∂2f(x0)∂x1∂x2∂2f(x0)∂x22∂2f(x0)∂xn∂x2∂2f(x0)⋯⋯⋯∂x1∂xn∂2f(x0)∂x2∂xn∂2f(x0)∂xn2∂2f(x0)
在 Taylor 展式中令 K=1,则有 f(x0+h)=f(x0)+f′(x0)h+21hTHf(x0)h+o(∣h∣2)。
隐函数存在定理:设二元函数 F(x,y) 在 U((x0,y0),δ) 内满足:
- F(x0,y0)=0
- F(x,y),Fy′(x,y) 在 U((x0,y0),δ) 内连续。
- Fy′(x0,y0)=0
则存在 0<δ0<δ,使得在 U(x0,δ0) 内存在唯一满足下述条件的连续函数 y=f(x):
- y0=f(x0)
- F(x,f(x))=0,∀x∈U(x0,δ0)
- 如果 Fx′(x,y) 在 U((x0,y0),δ) 内连续,则 f(x)∈C1(U(x0,δ0)),且 f′(x)=−Fy′(x,f(x))Fx′(x,f(x))。
不妨 Fy′(x0,y0)>0,则存在 δ0,∀(x,y)∈U((x0,y0),δ0),有 Fy′(x,y)>0。故 F(x0,y0−δ0)<0,F(x0,y0+δ0)>0,进而存在 δ1<δ0,∀x∈U(x0,δ1),F(x,y0−δ0)<0,F(x,y0+δ0)>0,故由单调性有唯一的 F(x,f(x))=0。
至于连续性,则由于 ∀ε>0,对于 y=f(x),有 F(x,y−ε)<0,F(x,y+ε)>0,故存在 δ 使得 ∀x∈U(x,δ),F(x,y−ε)<0,F(x,y+ε)>0,从而 f(x)∈(y−ε,y+ε),也即 ∣f(x)−f(x)∣<ε。
如果 x 的偏导数连续,那么设 Δy=f(x+Δx)−f(x)。由微分中值定理,0=F(x+Δx,y+Δy)−F(x,y)=Fx′(x+θΔx,y+θΔy)Δx+Fy′(x+θΔx,y+θΔy)Δy,移项后令 Δx→0 由连续性得证。
推广隐函数存在定理:设函数 F(x,y) 在 U((x0,y0),δ) 内满足:
- F(x0,y0)=0
- F(x,y),Fy′(x,y) 在 U((x0,y0),δ) 内连续。
- Fy′(x0,y0)=0
则存在 0<δ0<δ,使得在 U(x0,δ0) 内存在唯一满足下述条件的连续函数 y=f(x):
- y0=f(x0)
- F(x,f(x))=0,∀x∈U(x0,δ0)
- 如果 F(x,y) 在 U((x0,y0),δ) 内存在各个连续偏导数,则 f(x)∈C1(U(x0,δ0)),且 ∂xi∂f(x)=−Fy′(x,f(x))Fxi′(x,f(x))。
隐函数组存在定理:设 F(x,u) 在 U((x0,u0),δ) 内有定义,且满足
- F(x0,u0)=0
- Fj(x,u) 及它的各个偏导数在 U((x0,u0),δ) 内连续。
- ∂(u1,u2,⋯,um)∂(F1,F2,⋯,Fm)(x0,u0)=0
则存在 0<δ0<δ,使得在 U(x0,δ0) 内存在唯一满足下述条件的 m 维 n 元向量函数 f(x):
- u0=f(x0)
- F(x,f(x))=0,∀x∈U(x0,δ0)
- fj(x) 在 U(x0,δ0) 内存在连续偏导数,f′(x)=−(∂x∂F(x,u))−1(∂u∂F(x,u))
逆映射存在定理:设 y=f(x) 是区域 D 到 Ω 的一个 C1 映射,并且在 x0∈D 处有 ∂(x1,x2,⋯,xn)∂(f1,f2,⋯,fn)x0=0,记 y0=f(x0),则存在 U(x0,δ0)⊂D,使得 y=f(x) 是 U(x0,δ0) 到 f(U(x0,δ0)) 的 C1 同胚映射。
记 Fj(x,y)=yj−fj(x),考虑 F(x,y)=0 设个方程组,各个子函数的各偏导数都连续,并且 ∂(x1,x2,⋯,xn)∂(F1,F2,⋯,Fn)(x0,y0)=(−1)n∂(x1,x2,⋯,xn)∂(f1,f2,⋯,fn)x0=0,因此存在隐函数 x=g(y),且有各个连续偏导数。
定理:设 f(x) 在 x0 取极值且 f(x) 关于 xi 可偏导,则有 ∂xi∂f(x0)=0,特别的,若可微,则 f′(x0)=0。
f′(x0)=0,则称 x0 为 f(x) 的一个驻点/临界点,如果一个驻点不是极值点,则称为鞍点。
定理 f(x) 有二阶连续偏导数,f′(x0)=0,设 Hf(x0) 为满秩矩阵,则
- 正定 - 极小值
- 负定 - 极大值
- 不定 - 不取极值
由于 hTHf(x0)h 是 {h:∣h∣=1} 上的一个连续函数,又由于这是一个紧集,故有最大值 M 最小值 m。下面只证明正定,即 m>0。
f(x)=f(x0)+f′(x0)(x−x0)+21(x−x0)THf(x0)(x−x0)+o(∣x−x0∣2)>f(x0)+21∣x−x0∣(x−x0)THf(x0)∣x−x0∣x−x0∣x−x0∣2+o(∣x−x0∣2)>f(x0)+4m∣x−x0∣2
定理:设函数 f(x),φ(x)=(φ1(x),⋯,φm(x))T 在 D⊂Rn 有各个连续偏导数,m<n,x0 为 f(x) 在约束条件 φ(x)=0 下的极值点,φ′(x0) 的秩为 m,则存在 λ1,λ2,⋯,λm∈R,使得 x0 处成立下述等式:∂xi∂f(x0)+j=1∑mλj∂xi∂φj(x0)=0i=1,2,⋯,n
证明 n=2,m=1 的情况。φ′(x0,y0)=0,φ(x0,y0)=0,因此不妨存在隐函数 y=g(x)(或者反过来),x0 是 f(x,g(x)) 的一个通常极值点,因此 ∂x∂f(x0,y0)+∂y∂f(x0,y0)g′(x0)=0,结合 g′(x0)=−φy′(x0,y0)φx′(x0,y0),原命题得证。
这种求极值点的必要条件的方法称为拉格朗日乘数法。
设曲线 Γ 由连续映射 h(t),t∈[α,β] 所确定,且是单射,那么称为简单曲线。如果 h(α)=h(β) 且 h 在 [α,β) 是单射,那么称为简单闭曲线 / Jordan 曲线。
对于三维空间参数方程曲线 x=x(t),y=y(t),z=z(t),曲线在 x(t0) 处的切向量为 x′(t0),法平面用向量内积记为 x′(t0)⋅(x−x(t0))=0。而对于由 F1(x,y,z)=F2(x,y,z)=0 确定的曲线方程,如果 F′(x0,y0,z0) 的秩为 2,则由隐函数存在定理,在邻域内存在参数方程形式,故 F1 对 t 求偏导得 ∂x∂F1(x0)x′(t0)+∂y∂F1(x0)y′(t0)+∂z∂F1(x0)z′(t0)=0,对于 F2 同理,因此切向量与 F1′(x0)×F2′(x0)=Ai+Bj+Ck 平行,从而切向量为 Ax−x0=By−y0=Cz−z0,而法平面为 A(x−x0)+B(y−y0)+C(z−z0)=0。
对于三维空间 C1 曲面 F(x,y,z)=0,在 (x0,y0,z0) 处任取一条曲面上的光滑曲线 (x(t),y(t),z(t)),则 ∂x∂F1(x0)x′(t0)+∂y∂F1(x0)y′(t0)+∂z∂F1(x0)z′(t0)=0,因此可以推出切面方程为 ∂x∂F1(x0)(x−x0)+∂y∂F1(x0)(y−y0)+∂z∂F1(x0)(z−z0)=0,于是直线 Fx′(x0)x−x0=Fy′(x0)y−y0=Fz′(x0)z−z0 为法线方程。反之如果平面由参数方程 x=x(u,v),y=y(u,v),z=z(u,v) 定义,对于平面上的曲线 x=x(u0,v),y=y(u0,v),z=z(u0,v),切向量为 ∂u∂(x0,y0,z0)T=(xu′(u0,v0),yu′(u0,v0),zu′(u0,v0)),同理可知,法向量为 n=∂u∂(x0,y0,z0)T×∂v∂(x0,y0,z0)T=Ai+Bj+Ck,立刻得到法线方程和切平面方程。
设 D 是一个凸域,f(x) 在 D 内有定义,如果 ∀x0,x1∈D,∀t∈(0,1),有 f(tx1+(1−t)x2)≤tf(x1)+(1−t)f(x2),则称 f 在 D 内是凸函数,如果成立严格不等式则是严格凸函数。
定理:如果 f(x) 在 D 内有二阶连续偏导数,则 f 凸与下面两条均等价:
- ∀x0,x,成立 f(x)≥f(x0)+f′(x0)(x−x0)。
- ∀x0,Hf(x0) 半正定。
f(x0+tΔx)=f(x0)+tf′(x0)Δx+2t2ΔxTHf(x0)Δx+o(∣tΔx∣2)(∗)
由凸,f(x0+tΔx)≤tf(x0+Δx)+(1−t)f(x0),带入 (∗) 的一阶形式则 1 得证。反过来,tf(x1)+(1−t)f(x2)≥f(x0)+f′(x0)(t(x1−x0)+(1−t)(x2−x0)),令 x0=tx1+(1−t)x2 则得到凸的定义式。
把 1 和 (∗) 联立,令 t→0 立刻得到 2。而 2 结合 (∗) 自然说明 1。