工科高等代数3.24

696 words

3 minutes

工科高等代数3.24

2026-03-24

工高代

数学，线性代数

/

数学

$SVD(Singular-Value-Decomposition)$ #

定理：每个 $m\times n$ 实矩阵 $A$ 都可以写成#

$A=PSQ^{T}$
其中 $P,Q$ 是 $m$ 阶与 $n$ 阶正交矩阵，

\begin{align} S=\begin{bmatrix} \sigma_1 & & & \\ &... & & \\ & &\sigma_r & \\ & & &0 \\ \end{bmatrix}_{m\times n} \end{align}

$r=rank(A),\sigma_1\ge\sigma_2\ge...\ge...\sigma_r\ge0$
其中 $\sigma_i$ 为 $A^TA$ 正特征值的算术平方根
$S$ 为 $A$ 的奇异矩阵， $\sigma_i$ 为 $A$ 的奇异值，对应的向量为奇异向量
设 $A$ 为 $m\times n$ 实矩阵，由于 $AA^T$ 实对称
存在正交矩阵 $P$ 使得

\begin{align} AA^T=[\beta_1,\beta_2,...,\beta_m] \begin{bmatrix} \lambda_1 & & & \\ &... & & \\ & &\lambda_r & \\ & & &0 \\ \end{bmatrix}P^T \end{align}

且 $AA^T$ 的特征值非负：
$\lambda_1\ge\lambda_2\ge...\ge\lambda_r>\lambda_{r+1}=...=0$
由

\begin{align} (A^TP)^TA^TP=P^TAA^TP= \begin{bmatrix} \lambda_1 & & & \\ &... & & \\ & &\lambda_r & \\ & & &0 \\ \end{bmatrix} \end{align}

知 $A^TP$ 的列向量 $A^T\beta,...,A^T\beta_m$
两两正交且长度分别为
$\sqrt{\lambda_1},...,\sqrt{\lambda_r},0,...,0$
令 $\gamma_i=\frac{1}{\sqrt{\lambda_i}}A^T\beta_i$
则 $\gamma_1,...,\gamma_r$ 可扩充成 $R^n$ 的标准正交基
$\gamma_1,...,\gamma_r,...,\gamma_n$

\begin{cases} \gamma_{r+1}\gamma_1=0\\ \gamma_{r+1}\gamma_2=0\\ ...\\ \gamma_{r+1}\gamma_r=0\\ \end{cases}

解方程即可
记正交矩阵 $Q=[\gamma_1,...,\gamma_n]$ 我们有

\begin{align} A^TP =Q \begin{bmatrix} \sqrt{\lambda_1} & & & \\ &... & & \\ & &\sqrt{\lambda_r} & \\ & & &0 \\ \end{bmatrix}_{n\times m} \end{align}

故每个 $m\times n$ 实对称 $A$ 都能写成

\begin{align} A&=PSQ^{T}\\ &=[\beta_1,\beta_2,...,\beta_m] \begin{bmatrix} \sqrt{\lambda_1} & & & \\ &... & & \\ & &\sqrt{\lambda_r} & \\ & & &0 \\ \end{bmatrix}_{m\times n}[\gamma_1,\gamma_2,...,\gamma_n]^T\\ &=\sqrt{\lambda_1}\beta_1\gamma_1^T+\sqrt{\lambda_2}\beta_2\gamma_2^T+...+\sqrt{\lambda_r}\beta_r\gamma_r^T \end{align}

空间 $r+rn+rm->O((m+n)r)$
后面的奇异值很小接近零，

在秩 $k$ 的限制下矩阵 $A$ 的最佳逼近：#

$A_k=\sqrt{\lambda_1}\beta_1\gamma_1^T+\sqrt{\lambda_2}\beta_2\gamma_2^T+...+\sqrt{\lambda_k}\beta_k\gamma_k^T\rightarrow A$

由

\begin{align} AA^TP=[\beta_1,\beta_2,...,\beta_m] \begin{bmatrix} \sqrt{\lambda_1} & & & \\ &... & & \\ & &\sqrt{\lambda_r} & \\ & & &0 \\ \end{bmatrix}_{m\times n} \end{align}

得
$A[A^T\beta_1,A^T\beta_2,...,A^T\beta_r]=[\lambda_1\beta_1,\lambda_2\beta_2,...,\lambda_r\beta_r]$
$A[\gamma_1,\gamma_2,...,\gamma_r]=[\sqrt{\lambda_1}\beta_1,\sqrt{\lambda_2}\beta_2,...,\sqrt{\lambda_r}\beta_r]$

例：求下矩阵 $SVD$ 分解#

\begin{align} A=\begin{bmatrix} 1 &1\\ 1 &1\\ 1 &1\\ \end{bmatrix} \end{align}

1. $A^TA$ #

\begin{align} A^TA=\begin{bmatrix} 3 &3\\ 3 &3\\ \end{bmatrix} \end{align}

$\lambda_1=6,\lambda_2=0$
$\sigma_1=\sqrt6,\sigma_2=0$

2.右奇异向量#

\begin{align} \lambda_1=6,v_{1}=\frac{1}{\sqrt{2}}\begin{bmatrix} 1 \\ 1 \\ \end{bmatrix} \end{align}

\begin{align} \lambda_1=0,v_{2}=\frac{1}{\sqrt{2}}\begin{bmatrix} 1 \\ -1 \\ \end{bmatrix} \end{align}

3.求左奇异向量#

\begin{align} u_{1}=\frac{Av_1}{\sigma_1}=\frac{1}{\sqrt{6}}\begin{bmatrix} 2 \\ 2 \\ 2 \\ \end{bmatrix} =\frac{1}{\sqrt{3}}\begin{bmatrix} 1 \\ 1 \\ 1 \\ \end{bmatrix} \end{align}

补充正交基：#

\begin{align} u_{2}=\frac{1}{\sqrt{2}}\begin{bmatrix} 1 \\ -1 \\ 0 \\ \end{bmatrix}, u_3=\frac{1}{\sqrt{6}}\begin{bmatrix} 1 \\ 1 \\ -2 \\ \end{bmatrix} \end{align}

\begin{align} A=[u_1,u_2,u_3]\begin{bmatrix} \sqrt{6} &0\\ 0 &0\\ 0 &0\\ \end{bmatrix}[v_1,v_2]^T \end{align}

$Moore--Penrose$ 广义逆#

实数域下 $MP$ 广义逆的定义
$AA^{\dagger}A=A$
$A^\dagger AA^\dagger=A^\dagger$
$(AA^{\dagger})^T=AA^\dagger$
$(A^{\dagger}A)^T=A^\dagger A$
第一个满足 $(AA^\dagger-I)A=0$
存在且唯一，
可逆时 $A^\dagger=A^{-1}$ ，
$(A^\dagger)^\dagger=A$
考虑如何解析的求出来

定理：#

$A=PSQ^T=(PQ^T)QSQ^T$
每个实方阵都可以写成一个正交矩阵与一个实对称矩阵的乘积
实矩阵的 $M-P$ 广义逆：若 $A=PSQ^T$ ,则

\begin{align} A^\dagger=Q\begin{bmatrix} \sigma_1^{-1} & & & \\ &... & & \\ & &\sigma_r^{-1} & \\ & & &0 \\ \end{bmatrix}_{n\times m}P^T \end{align}

\begin{align} AA^\dagger=P\begin{bmatrix} I_{r} &0 \\ 0 &0 \\ \end{bmatrix}P^T \end{align}

证明：

1.存在性：奇异值分解#

2.唯一性：#

设 $X,Y\in C^{n\times m}$ 均满足上述条件
$A=AYA\rightarrow X=XAX--X=X(AYA)X=XAYAX$
$Y=YAY\rightarrow XAYAX=XA(YAY)AX=(XAY)A(YAX)$
由 $(AX)^T=AX,(AY)^T=AY$
$XAY=(XAY)^T=YAX(*)$
于是 $X=(XAY)A(YAX)=(XAY)A(XAY)$
同理 $Y=(XAY)A(XAY)$
则 $X=Y$
注：从 $(*)$ 开始推导错误

\begin{align} X&=XAX\\ &=X(AX)^T\\ &=XX^{T}A^T\\ &=XX^{T}(AYA)^T\\ &=XX^TA^TY^TA^T\\ &=X(X^TA^T)(Y^TA^T)\\ &=X(AX)^T(AY)^T\\ &=XAXAY\\ &=XAY \end{align}

\begin{align} Y&=YAY\\ &=(YA)^TY\\ &=A^TY^TY\\ &=(AXA)^TY^TY\\ &=A^TX^TA^TY^TY\\ &=XAYAY\\ &=XAY=Y \end{align}

设 $A\in R^{m\times n}$ ，定义 $P=AA^{\dagger}$ .证明 $P$ 是 $col(A)$ 的正交投影算子：#

$P^2=P,P^T=P,range(P)=col(A)$
$P^{2}=AA^{\dagger}AA^{\dagger}=(AA^{\dagger}A)A^{\dagger}=AA^{\dagger}=P$
$P^{T}=(AA^{\dagger})^{T}=AA^\dagger=P$
对 $\forall x\in R^n$
$Px=AA^\dagger x=A(A^\dagger x)\in col(A)$
则 $range(P)\subseteq col(A)$
对 $y\in col(A),\exists z,st.y=Az$
$Py=AA^{\dagger}Az=Az=y$
则 $col(A)\subseteq range(P)$
故 $range(P)=col(A)$

证明： $trace(A^TA)=\sum_{i}\sigma_i^2$ #

$A=U\Sigma V^{T}=(a_{ij})_{m\times n}$
$tr(A^TA)=tr(V\Sigma^TU^TU\Sigma V^T)=tr(V\Sigma^T\Sigma V^T)=tr(\Sigma V^T V\Sigma^T)=tr(\Sigma\Sigma^T)$
$\sum_{i,j}a_{i,j}^{2}=\sum_{i}\sigma_i^2$
设 $A\in R^{m\times n},$ 证明：
$max_{||x||_2=1}||Ax||_2=\sigma_{max}(A)$
只要看 $||Ax||_2^2$ 的最大值
$||Ax||_2^2=\langle Ax,Ax\rangle=x^TA^TAx$
$max_{||x||_2=1}||Ax||_2^2=\lambda_{max}(A)$
$max_{||x||_2=1}||Ax||_2=\sigma_{max}(A)$