266 words
1 minute
工科高等代数3.31

证明(MPMP广义逆的唯一性)#

XXYY都是MPMP广义逆
(1)X=XAXcol(X)col(XA)(1)X=XAX\to col(X)\subseteq col(XA)

col(XA)col(X)col(X)=col(XA)row(XA)row(A)col(XA)\subset col(X)\to col(X)=col(XA) \to row(XA)\subseteq row(A)
(2)A+AYAA(IYA)=0(2)A+AYA\to A(I-YA)=0

col(IYA)ker(A)=xxrow(A)col(AYA)col(X)(IYA)X=0X=YAX\begin{align} &\to col(I-YA)\subseteq ker(A)={x|x\perp row(A)}\\ &\to col(A-YA)\perp col(X)\\ &\to(I-YA)X=0\\ &\to X=YAX \end{align}

(3)Y=YAYrow(Y)row(AYcol(AY)col(A)(3)Y=YAY\to row(Y)\subseteq row(AY\to col(AY)\subseteq col(A)
(IAX)A=0AT(IAX)=0(I-AX)A=0\to A^T(I-AX)=0

col(IYA)ker(AT)=[row(AT)]=[col(A)]row(Y)col(IAX)(IAX)YT=0Y(IAX)=0Y=YAX\begin{align} &\to col(I-YA)\subseteq ker(A^T)=[row(A^T)]^{\perp}=[col(A)]^{\perp}\\ &\to row(Y)\perp col(I-AX)\\ &\to(I-AX)Y^T=0\to Y(I-AX)=0\\ &\to Y=YAX \end{align}

范数#

(a)v0,v=0v=0(a)||\vec{v}||\ge 0,||\vec{v}||=0\leftrightarrow \vec{v}=\vec{0}
(b)αv=αv,αR(b)||\alpha\vec{v}||=|\alpha|||\vec{v}||,\forall \alpha\in R
(c)u+vv+u(c)||\vec{u}+\vec{v}||\le||\vec{v}||+||\vec{u}||

pp范数#

vp=(i=1mvip)1p||\vec{v}||_{p}=(\sum_{i=1}^{m}|v_i|^{p})^{\frac{1}{p}}
HWHW证明pp范数

\infty范数#

v=max1imvi||\vec{v}||_{\infty}=max_{1\le i\le m}|v_{i}|
范数等价
c1vβvαc2vβc_1||\vec{v}||_{\beta}\le||\vec{v}||_{\alpha}\le c_2||\vec{v}||_{\beta}

{vv1mvvv2mv1mv1v2v1\begin{cases} ||\vec{v}||_{\infty}\le||\vec{v}||_{1}\le m||\vec{v}||_{\infty}\\ ||\vec{v}||_{\infty}\le||\vec{v}||_{2}\le \sqrt{m}||\vec{v}||_{\infty}\\ \frac{1}{\sqrt{m}}||\vec{v}||_{1}\le||\vec{v}||_{2}\le||\vec{v}||_{1} \end{cases}

矩阵范数#

(i)(ii)(iii)(i)(ii)(iii)同上
(iv)ABAB(iv)\|AB\|\le\|A\|\|B\|
A2=maxx2=1Ax2=σmax(A)\|A\|_{2}=\max_{\|x\|_{2}=1}\|Ax\|_{2}=\sigma_{max}(A)
A=maxv=1Av\|A\|=\max_{\|\vec{v}\|=1}\|A\vec{v}\|
Aαβ=maxvα=βAvα\|A\|_{\alpha\to\beta}=\max_{\|\vec{v}\|_{\alpha}=\beta}\|A\vec{v}\|_{\alpha}
(1)A1=maxv1=1Av1=maxj(i=1maij)(1)\|A\|_{1}=\max_{\|\vec{v}\|_{1}=1}\|A\vec{v}\|_{1}=\max_{j}(\sum_{i=1}^{m}|a_{ij}|)

Av1=i=1nai,1v1++ai,nvn=i=1mj=1nai,jvji=1mj=1nai,jvj=j=1ni=1nai,jvj=j=1nvji=1nai,jmaxj(i=1nai,j)\begin{align} \|A\vec{v}\|_{1}&=\sum_{i=1}^{n}|a_{i,1}v_{1}+\dots+a_{i,n}v_{n}|\\ &=\sum_{i=1}^{m}|\sum_{j=1}^{n}a_{i,j}v_j|\\ &\le\sum_{i=1}^{m}\sum_{j=1}^{n}|a_{i,j}||v_j|\\ &=\sum_{j=1}^{n}\sum_{i=1}^{n}|a_{i,j}||v_j|\\ &=\sum_{j=1}^{n}|v_j|\sum_{i=1}^{n}|a_{i,j}|\\ &\le \max_{j}(\sum_{i=1}^{n}|a_{i,j}|) \end{align}

v\vec{v}在最大列的的分量为11时取最大
(2)A=maxv=1Av=max1jm(i=1naij)(HW)(2)\|A\|_{\infty}=\max_{\|\vec{v}\|_{\infty}=1}\|A\vec{v}\|_{\infty}=\max_{1\le j\le m}(\sum_{i=1}^{n}|a_{ij}|)(HW)
最大列和
(3)A2=maxv2=1Av2=λmax(ATA)(3)\|A\|_{2}=\max_{\|\vec{v}\|_{2}=1}\|A\vec{v}\|_{2}=\sqrt{\lambda_{max}(A^TA)}

FF范数#

AF=i,jai,j2\|A\|_{F}=\sqrt{\sum_{i,j}a_{i,j}^{2}}
not a an operator norm.
AF=tr(ATA)=i=1nσi2=A,A\|A\|_{F}=\sqrt{tr(A^TA)}=\sqrt{\sum_{i=1}^{n}\sigma_{i}^2}=\langle A,A\rangle

{A2AFrank(A)A2A2A1AAnA2,A1mA2(HW)\begin{cases} \|A\|_{2}\le\|A\|_{F}\le \sqrt{rank(A)}\|A\|_{2}\\ \|A\|_{2}\le \sqrt{\|A\|_{1}\|A\|_{\infty}}\\ \|A\|_{\infty}\le \sqrt{n}\|A\|_{2},\|A\|_{1}\le \sqrt{m}\|A\|_{2} \end{cases} (HW)

EckhartYoungEckhart-Young定理#

k<r=rank(A),Ak=i=1kσiuiviTk<r=rank(A),A_{k}=\sum_{i=1}^{k}\sigma_{i}u_{i}v_{i}^{T}
minrank(B)=kAB2=AAk=σk+1\min_{rank(B)=k}\|A-B\|_{2}=\|A-A_{k}\|=\sigma_{k+1}

UTAkV=diag{σ1,,σk,0,,0}U^{T}A_{k}V=diag\{\sigma_1,\dots,\sigma_{k},0,\dots,0\}
UT(AAk)V=diag{0,,0,σk+1,,σp}U^{T}(A-A_{k})V=diag\{0,\dots,0,\sigma_{k+1},\dots,\sigma_p\}
AAk2=σk+1\|A-A_{k}\|_{2}=\sigma_{k+1}
rank(B)=krank(B)=kBB的零空间null(B)=span{x1,,xnk}null(B)=span\{x_{1},\dots,x_{n-k}\}
span{x1,,xnk}span{v1,,vk+1}0span\{x_{1},\dots,x_{n-k}\}\cap span\{v_{1},\dots,v_{k+1}\}\neq0
zz为其交集的单位向量

(AB)z2=Az2=(i=1pσiuiviT)z2=(i=1k+1σiuiviT)z2(AB)22Az22=i=1k+1σi2(viTui)2σk+12\begin{align} \|(A-B)z\|_{2}&=\|Az\|_{2}\\ &=\|(\sum_{i=1}^{p}\sigma_iu_iv_{i}^{T})z\|_{2}\\ &=\|(\sum_{i=1}^{k+1}\sigma_iu_iv_{i}^{T})z\|_{2}\\ \|(A-B)\|_{2}^{2}&\ge\|Az\|_{2}^{2}=\sum_{i=1}^{k+1}\sigma_i^2(v_i^Tu_i)^2\ge\sigma_{k+1}^2 \end{align}

minrank(B)ABF=σk12++σp2\min_{rank(B)}\|A-B\|_{F}=\sqrt{\sigma_{k_1}^2+\dots+\sigma_{p}^2}

CURCUR分解#

ARm×n,rank(A)=k,I[m],J[n],I=tk,J=skA\in R^{m\times n},rank(A)=k,I\subset[m],J\subset[n],|I|=t\ge k,|J|=s\ge k
C=A(:,J),R=A(I,:),U=A(I,J)C=A(:,J),R=A(I,:),U=A(I,J)
如果rank(U)=rank(A)rank(U)=rank(A)
A=CURA=CU^{\dagger}R
证明待补
线性系统

{A(x+δx)=b+δbAx=b\begin{cases} A(x+\delta x)=b+\delta b\\ Ax=b \end{cases}

Aδx=δbA\delta x=\delta b

δb2=Aδx2A2δx2δx2A21δb2δx2=A1δb2A12δb2\begin{align} \|\delta b\|_{2}&=\|A\delta x\|_{2}\\ &\le\|A\|_{2}\|\delta x\|_{2}\\ \|\delta x\|_2&\ge\|A\|_2^{-1}\|\delta b\|_2\\ \|\delta x\|_2&=\|A^{-1}\delta b\|_2\\ &\le \|A^{-1}\|_{2}\|\delta b\|_{2} \end{align}

故(假设AA可逆)
δx2x2A12A2δb2b2=κ(A)δb2b2=σ1σnδb2b2\frac{\|\delta x\|_2}{\|x\|_2}\le \|A^{-1}\|_2\|A\|_2\frac{\|\delta b\|_2}{\|b\|_2}=\kappa(A)\frac{\|\delta b\|_2}{\|b\|_2}=\frac{\sigma_1}{\sigma_n}\frac{\|\delta b\|_2}{\|b\|_2}
AA不可逆
κ(A)=σ1σr=A2A2\kappa(A)=\frac{\sigma_1}{\sigma_r}=\|A\|_2\|A^{\dagger}\|_2

最小二乘法#

Ac=yA\vec{c}=\vec{y}

mincRn(Acy22)=(Acy)T(Acy)=cTATAc2cTATy+yTy\begin{align} \min_{\vec{c}\in R^n}(\|A\vec{c}-\vec{y}\|_2^2)&=(A\vec{c}-\vec{y})^T(A\vec{c}-\vec{y})\\ &=\vec{c}^TA^TA\vec{c}-2\vec{c}^TA^T\vec{y}+\vec{y}^T\vec{y} \end{align}

f:Rm×nR,XRm×nf:R^{m\times n}\to R,X\in R^{m\times n}
Xf(X)\nabla_{X}f(X)为与XX维度完全相同的矩阵
[Xf(X)]ij=fXij[\nabla_{X}f(X)]_{ij}=\frac{\partial f}{\partial X_{ij}}
(1)f(x)=aTx,x(aTx)=a(1)f(\vec{x})=\vec{a}^T\vec{x},\nabla_{\vec{x}}(\vec{a}^T\vec{x})=\vec{a}
(2)f(x)=xTy,f(x)=yTx,x(xTy)=x(yTx)=y(2)f(\vec{x})=\vec{x}^T\vec{y},f(\vec{x})=\vec{y}^T\vec{x},\nabla_{\vec{x}}(\vec{x}^T\vec{y})=\nabla_{\vec{x}}(\vec{y}^T\vec{x})=\vec{y}
(3)f(x)=xTx,x(xTx)=2x(3)f(\vec{x})=\vec{x}^T\vec{x},\nabla_{\vec{x}}(\vec{x}^T\vec{x})=2\vec{x}
(4)f(x)=xTAx,x(xTAx)=(A+AT)x(4)f(\vec{x})=\vec{x}^TA\vec{x},\nabla_{\vec{x}}(\vec{x}^TA\vec{x})=(A+A^T)\vec{x}