Processing math: 100%

[DL Note] 线性代数:特征分解

1. 特征向量

  An×n 矩阵,x 为非零向量,若存在数 λ 使 Ax=λx 有非平凡解 x,则称 λA特征值(eigenvalue),x 称为对应于 λ特征向量(eigenvector)。

  λA 的特征值当且仅当方程

(AλI)x=0

有非平凡解。方程 (1) 的所有解的集合就是矩阵 AλI 的零空间,因此该集合是 Rn 的子空间,称为 A 的对应于 λ特征空间。特征空间由零向量和所有对应于 λ 的特征向量组成。

  三角矩阵(包含上三角和下三角矩阵)的主对角线的元素是其特征值。

  如果一个矩阵 A 有零特征值,则方程 Ax=0x 有非平凡解,该方程等价于 Ax=0,而 Ax=0 有非平凡解的充要条件是 A 是不可逆的。因此,A 有零特征值的充要条件是 A 不可逆。0A 的特征值当且仅当 A 不可逆。

  λ1,,λrn×n 矩阵 A 相异的特征值,v1,,vr 是与 λ1,,λr 对应的特征向量,那么向量集合 {v1,,vr} 线性无关。

  如果 vA 的特征向量,那么任何缩放后的向量 svsRs0)也是 A 的特征向量,svv 有相同的特征值,因此通常只考虑单位特征向量。

2. 谱定理

  矩阵 A 的特征值的集合有时称为 A。一个对称的 n×n 矩阵 A 具有下述性质:

  1. An 个特征值,包含重复的特征值。
  2. 对每一个特征值 λ,对应的特征空间的维数等于 λ 作为特征方程的根的重数。
  3. 特征空间相互正交,这种正交性是在特征向量对应于不同特征值的意义下成立的。
  4. A 可正交对角化。

3. 特征分解

  假设 A=PDP1,其中 P 的列是 A 的单位正交特征向量 u1,,un,是一个正交矩阵;相应的特征值 λ1,,λn 属于对角矩阵 D,由 P1=PT,有

A=PDPT=[u1un][λ100λn][uT1uTn]=[λ1u1λnun][uT1uTn]

利用乘积的行列式展开式,可以得到

A=λ1u1uT1+λ2u2uT2++λnunuTn

由于它将 A 分解为由 A 的谱(特征值)确定的小块,因此这个 A 的表示就称为 A谱分解(spectral decomposition),也称为特征分解(eigendecomposition)。式 (3) 中的每一项都是一个秩为 1n×n 矩阵。例如,λ1u1uT1 的每一列都是 u1 的倍数。

  并不是每个矩阵都能有特征分解;对于每个实对称矩阵,都可以分解为式 (2) 的形式,但分解可能不唯一。特征分解唯一当且仅当所有的特征值都是唯一的。如果两个或多个特征向量有相同的特征值,则在由这些特征向量生成的子空间中,任意一组正交向量都是该特征值对应的特征向量,从而构成一种正交分解。

  正交分解可以提供很多关于矩阵的信息。矩阵是奇异的当且仅当含有零特征值。

4. 二次型

  Rn 上的一个二次型是一个定义在 Rn 上的函数,它在向量 x 处的值可由表达式 Q(x)=xTAx 计算,其中 A 是一个 n×n 矩阵。矩阵 A 称为关于二次型的矩阵

  实矩阵的特征分解可以用于优化二次方程 Q(x)=xTAx,其中限制 x2=1。当 x 等于 A 的某个特征向量时,f(x) 为对应的特征值。在限制条件下,函数 Qf 的最大值是最大特征值,最小值是最小特征值。

  定义一个二次型 Q 是:

  • 正定(positive definite)的,如果对所有 x0,有 Q(x)>0
  • 负定(negative definite)的,如果对所有 x0,有 Q(x)<0
  • 不定的,如果 Q(x) 既有正值又有负值。

此外,对所有 x,如果 Q(x)0,则称 Q半正定(positive semidefinite)的;如果 Q(x)0,则称 Q半负定(negative semidefinite)的。

  设 An×n 对称矩阵,那么一个二次型 xTAx 是:

  • 正定的,当且仅当 A 的所有特征值是正数。
  • 负定的,当且仅当 A 的所有特征值是负数。
  • 不定的,当且仅当 A 既有正特征值,又有负特征值。

  利用二次型的分类,相应的得到矩阵的形式分类。所有特征值都是正数的矩阵称为正定矩阵,所有特征值都是负数的矩阵称为负定矩阵,所有特征值都是非负的矩阵称为半正定矩阵,所有特征值都是非正的矩阵称为半负定矩阵。

  半正定矩阵保证对于 x,有 xTAx0。正定矩阵保证当 xTAx=0 时,有 x=0