证明(MP广义逆的唯一性)#
设X和Y都是MP广义逆
(1)X=XAX→col(X)⊆col(XA)
又
col(XA)⊂col(X)→col(X)=col(XA)→row(XA)⊆row(A)
(2)A+AYA→A(I−YA)=0
→col(I−YA)⊆ker(A)=x∣x⊥row(A)→col(A−YA)⊥col(X)→(I−YA)X=0→X=YAX(3)Y=YAY→row(Y)⊆row(AY→col(AY)⊆col(A)
(I−AX)A=0→AT(I−AX)=0
→col(I−YA)⊆ker(AT)=[row(AT)]⊥=[col(A)]⊥→row(Y)⊥col(I−AX)→(I−AX)YT=0→Y(I−AX)=0→Y=YAX
(a)∣∣v∣∣≥0,∣∣v∣∣=0↔v=0
(b)∣∣αv∣∣=∣α∣∣∣v∣∣,∀α∈R
(c)∣∣u+v∣∣≤∣∣v∣∣+∣∣u∣∣
p范数#
∣∣v∣∣p=(∑i=1m∣vi∣p)p1
HW证明p范数
∞范数#
∣∣v∣∣∞=max1≤i≤m∣vi∣
范数等价
c1∣∣v∣∣β≤∣∣v∣∣α≤c2∣∣v∣∣β
⎩⎨⎧∣∣v∣∣∞≤∣∣v∣∣1≤m∣∣v∣∣∞∣∣v∣∣∞≤∣∣v∣∣2≤m∣∣v∣∣∞m1∣∣v∣∣1≤∣∣v∣∣2≤∣∣v∣∣1
矩阵范数#
(i)(ii)(iii)同上
(iv)∥AB∥≤∥A∥∥B∥
∥A∥2=max∥x∥2=1∥Ax∥2=σmax(A)
∥A∥=max∥v∥=1∥Av∥
∥A∥α→β=max∥v∥α=β∥Av∥α
(1)∥A∥1=max∥v∥1=1∥Av∥1=maxj(∑i=1m∣aij∣)
∥Av∥1=i=1∑n∣ai,1v1+⋯+ai,nvn∣=i=1∑m∣j=1∑nai,jvj∣≤i=1∑mj=1∑n∣ai,j∣∣vj∣=j=1∑ni=1∑n∣ai,j∣∣vj∣=j=1∑n∣vj∣i=1∑n∣ai,j∣≤jmax(i=1∑n∣ai,j∣)v在最大列的的分量为1时取最大
(2)∥A∥∞=max∥v∥∞=1∥Av∥∞=max1≤j≤m(∑i=1n∣aij∣)(HW)
最大列和
(3)∥A∥2=max∥v∥2=1∥Av∥2=λmax(ATA)
F范数#
∥A∥F=∑i,jai,j2
not a an operator norm.
∥A∥F=tr(ATA)=∑i=1nσi2=⟨A,A⟩
⎩⎨⎧∥A∥2≤∥A∥F≤rank(A)∥A∥2∥A∥2≤∥A∥1∥A∥∞∥A∥∞≤n∥A∥2,∥A∥1≤m∥A∥2(HW)
Eckhart−Young定理#
k<r=rank(A),Ak=∑i=1kσiuiviT
minrank(B)=k∥A−B∥2=∥A−Ak∥=σk+1
UTAkV=diag{σ1,…,σk,0,…,0}
UT(A−Ak)V=diag{0,…,0,σk+1,…,σp}
故 ∥A−Ak∥2=σk+1
设rank(B)=k,B的零空间null(B)=span{x1,…,xn−k}
span{x1,…,xn−k}∩span{v1,…,vk+1}=0
令z为其交集的单位向量
∥(A−B)z∥2∥(A−B)∥22=∥Az∥2=∥(i=1∑pσiuiviT)z∥2=∥(i=1∑k+1σiuiviT)z∥2≥∥Az∥22=i=1∑k+1σi2(viTui)2≥σk+12minrank(B)∥A−B∥F=σk12+⋯+σp2
CUR分解#
A∈Rm×n,rank(A)=k,I⊂[m],J⊂[n],∣I∣=t≥k,∣J∣=s≥k
C=A(:,J),R=A(I,:),U=A(I,J)
如果rank(U)=rank(A)则
A=CU†R
证明待补
线性系统
{A(x+δx)=b+δbAx=bAδx=δb
∥δb∥2∥δx∥2∥δx∥2=∥Aδx∥2≤∥A∥2∥δx∥2≥∥A∥2−1∥δb∥2=∥A−1δb∥2≤∥A−1∥2∥δb∥2故(假设A可逆)
∥x∥2∥δx∥2≤∥A−1∥2∥A∥2∥b∥2∥δb∥2=κ(A)∥b∥2∥δb∥2=σnσ1∥b∥2∥δb∥2
若A不可逆
κ(A)=σrσ1=∥A∥2∥A†∥2
最小二乘法#
Ac=y
c∈Rnmin(∥Ac−y∥22)=(Ac−y)T(Ac−y)=cTATAc−2cTATy+yTyf:Rm×n→R,X∈Rm×n
∇Xf(X)为与X维度完全相同的矩阵
[∇Xf(X)]ij=∂Xij∂f
(1)f(x)=aTx,∇x(aTx)=a
(2)f(x)=xTy,f(x)=yTx,∇x(xTy)=∇x(yTx)=y
(3)f(x)=xTx,∇x(xTx)=2x
(4)f(x)=xTAx,∇x(xTAx)=(A+AT)x