[DL Note] 线性代数:特征分解
Contents [show]
1. 特征向量
A 为 n×n 矩阵,x 为非零向量,若存在数 λ 使 Ax=λx 有非平凡解 x,则称 λ 为 A 的特征值(eigenvalue),x 称为对应于 λ 的特征向量(eigenvector)。
λ 是 A 的特征值当且仅当方程
(A–λI)x=0
有非平凡解。方程 (1) 的所有解的集合就是矩阵 A–λI 的零空间,因此该集合是 Rn 的子空间,称为 A 的对应于 λ 的特征空间。特征空间由零向量和所有对应于 λ 的特征向量组成。
三角矩阵(包含上三角和下三角矩阵)的主对角线的元素是其特征值。
如果一个矩阵 A 有零特征值,则方程 Ax=0x 有非平凡解,该方程等价于 Ax=0,而 Ax=0 有非平凡解的充要条件是 A 是不可逆的。因此,A 有零特征值的充要条件是 A 不可逆。0 是 A 的特征值当且仅当 A 不可逆。
λ1,⋯,λr 是 n×n 矩阵 A 相异的特征值,v1,⋯,vr 是与 λ1,⋯,λr 对应的特征向量,那么向量集合 {v1,⋯,vr} 线性无关。
如果 v 是 A 的特征向量,那么任何缩放后的向量 sv(s∈R 且 s≠0)也是 A 的特征向量,sv 与 v 有相同的特征值,因此通常只考虑单位特征向量。
2. 谱定理
矩阵 A 的特征值的集合有时称为 A 的谱。一个对称的 n×n 矩阵 A 具有下述性质:
- A 有 n 个特征值,包含重复的特征值。
- 对每一个特征值 λ,对应的特征空间的维数等于 λ 作为特征方程的根的重数。
- 特征空间相互正交,这种正交性是在特征向量对应于不同特征值的意义下成立的。
- A 可正交对角化。
3. 特征分解
假设 A=PDP−1,其中 P 的列是 A 的单位正交特征向量 u1,⋯,un,是一个正交矩阵;相应的特征值 λ1,⋯,λn 属于对角矩阵 D,由 P−1=PT,有
A=PDPT=[u1⋯un][λ10⋱0λn][uT1⋮uTn]=[λ1u1⋯λnun][uT1⋮uTn]
利用乘积的行列式展开式,可以得到
A=λ1u1uT1+λ2u2uT2+⋯+λnunuTn
由于它将 A 分解为由 A 的谱(特征值)确定的小块,因此这个 A 的表示就称为 A 的谱分解(spectral decomposition),也称为特征分解(eigendecomposition)。式 (3) 中的每一项都是一个秩为 1 的 n×n 矩阵。例如,λ1u1uT1 的每一列都是 u1 的倍数。
并不是每个矩阵都能有特征分解;对于每个实对称矩阵,都可以分解为式 (2) 的形式,但分解可能不唯一。特征分解唯一当且仅当所有的特征值都是唯一的。如果两个或多个特征向量有相同的特征值,则在由这些特征向量生成的子空间中,任意一组正交向量都是该特征值对应的特征向量,从而构成一种正交分解。
正交分解可以提供很多关于矩阵的信息。矩阵是奇异的当且仅当含有零特征值。
4. 二次型
Rn 上的一个二次型是一个定义在 Rn 上的函数,它在向量 x 处的值可由表达式 Q(x)=xTAx 计算,其中 A 是一个 n×n 矩阵。矩阵 A 称为关于二次型的矩阵。
实矩阵的特征分解可以用于优化二次方程 Q(x)=xTAx,其中限制 ‖x‖2=1。当 x 等于 A 的某个特征向量时,f(x) 为对应的特征值。在限制条件下,函数 Qf 的最大值是最大特征值,最小值是最小特征值。
定义一个二次型 Q 是:
- 正定(positive definite)的,如果对所有 x≠0,有 Q(x)>0。
- 负定(negative definite)的,如果对所有 x≠0,有 Q(x)<0。
- 不定的,如果 Q(x) 既有正值又有负值。
此外,对所有 x,如果 Q(x)≥0,则称 Q 是半正定(positive semidefinite)的;如果 Q(x)≤0,则称 Q 是半负定(negative semidefinite)的。
设 A 是 n×n 对称矩阵,那么一个二次型 xTAx 是:
- 正定的,当且仅当 A 的所有特征值是正数。
- 负定的,当且仅当 A 的所有特征值是负数。
- 不定的,当且仅当 A 既有正特征值,又有负特征值。
利用二次型的分类,相应的得到矩阵的形式分类。所有特征值都是正数的矩阵称为正定矩阵,所有特征值都是负数的矩阵称为负定矩阵,所有特征值都是非负的矩阵称为半正定矩阵,所有特征值都是非正的矩阵称为半负定矩阵。
半正定矩阵保证对于 ∀x,有 xTAx≥0。正定矩阵保证当 xTAx=0 时,有 x=0。