线性代数 Cheat Sheet 5-4:特征向量与线性变换

1. 线性变换的矩阵

  设 $V$ 是 $n$ 维向量空间,$W$ 是 $m$ 维向量空间,$T$ 是 $V$ 到 $W$ 的线性变换。为了把 $T$ 与矩阵相联系,指定 $\mathcal{B}$ 和 $\mathcal{C}$ 分别是 $V$ 和 $W$ 的基。

  若 $\boldsymbol x \in V$,坐标向量 $[\boldsymbol x]_\mathcal{B} \in \mathbb{R}^n$,$\boldsymbol x$ 的像 $T(\boldsymbol x)$ 的坐标向量 $[T(\boldsymbol x)]_\mathcal{C} \in \mathbb{R}^m$。

  容易找出 $[\boldsymbol x]_\mathcal{B}$ 与 $[T(\boldsymbol x)]_\mathcal{C}$ 的关系。设 $V$ 的基 $\mathcal{B}$ 是 $\{\boldsymbol b_1, \cdots, \boldsymbol b_n\}$。若 $\boldsymbol x = r_1 \boldsymbol b_1, + \cdots + r_n \boldsymbol b_n$,则

\begin{equation}
[\boldsymbol x]_\mathcal{B} = \begin{bmatrix} r_1 \\ \vdots \\ r_n\end{bmatrix}
\end{equation}

因为 $T$ 是线性的,故

\begin{equation}
T(\boldsymbol x) = T(r_1 \boldsymbol b_1, + \cdots + r_n \boldsymbol b_n) = r_1 T(\boldsymbol b_1) + \cdots + r_n T(\boldsymbol b_n) \tag{1}
\end{equation}

因为从 $W$ 到 $\mathbb{R}^m$ 的坐标映射是线性的,故等式 $(1)$ 可推出

\begin{equation}
[T(\boldsymbol x)]_\mathcal{C} = r_1 [T(\boldsymbol b_1)]_\mathcal{C} + \cdots + r_n [T(\boldsymbol b_n)]_\mathcal{C} \tag{2}
\end{equation}

因为这些 $\mathcal{C}-$ 坐标向量都属于 $\mathbb{R}^m$,故向量等式 $(2)$ 可以写为矩阵等式

\begin{equation}
[T(\boldsymbol x)]_\mathcal{C} = M [\boldsymbol x]_\mathcal{B} \tag{3}
\end{equation}

其中

\begin{equation}
M = \begin{bmatrix} [T(\boldsymbol b_1)]_\mathcal{C} & [T(\boldsymbol b_2)]_\mathcal{C} & \cdots & [T(\boldsymbol b_n)]_\mathcal{C}\end{bmatrix} \tag{4}
\end{equation}

矩阵 $M$ 是 $T$ 的矩阵表示,称为$T$ 相对于基 $\mathcal{B}$ 和 $\mathcal{C}$ 的矩阵

  如果 $\mathcal{B}$ 和 $\mathcal{C}$ 是同一空间 $V$ 的基,$T$ 是恒等变换 $T(\boldsymbol x) = \boldsymbol x, x \in V$,那么 $(4)$ 中的矩阵 $M$ 正好是坐标变换矩阵。

2. $V$ 到 $V$ 的线性变换

  当 $W = V$,$\mathcal{C} = \mathcal{B}$ 时,$(4)$ 中的 $M$ 称为 $T$ 相对于 $\mathcal{B}$ 的矩阵,或简称为 $T$ 的 $\mathcal{B}-$ 的矩阵,记为 $[T]_\mathcal{B}$。

  $V \rightarrow V$ 的线性变换 $T$ 的 $\mathcal{B}-$ 矩阵对所有 $V$ 中的 $\boldsymbol x$,有

\begin{equation}
[T(\boldsymbol x)]_\mathcal{B} = [T]_\mathcal{B} [\boldsymbol x]_\mathcal{B}
\end{equation}

3. $\mathbb{R}^n$ 上的线性变换

  在涉及 $\mathbb{R}^n$ 的应用问题中,线性变换首先表现为一个矩阵变换 $\boldsymbol x \mapsto A \boldsymbol x$。假设 $A$ 是可对角化的,那么存在由 $A$ 的特征向量组成的 $\mathbb{R}^n$ 的基 $\mathcal{B}$。此时,下面的定理 8 表明 $T$ 的 $\mathcal{B}-$ 矩阵是对角矩阵,这样,把 $A$ 对角化相当于找到变换 $\boldsymbol x \mapsto A \boldsymbol x$ 的对角矩阵表示。

  定理 8(对角矩阵表示)设 $A = PDP^{-1}$,其中 $D$ 为 $n \times n$ 对角矩阵,若 $\mathbb{R}^n$ 的基 $\mathcal{B}$ 由 $P$ 的列向量组成,那么 $D$ 是变换 $\boldsymbol x \mapsto A \boldsymbol x$ 的 $\mathcal{B}-$ 矩阵。

4. 矩阵变换的相似性

  若 $A$ 相似于 $C$,即有 $A = PCP^{-1}$,且 $\mathcal{B}$ 由 $P$ 的列向量组成,则 $C$ 是变换 $\boldsymbol x \mapsto A \boldsymbol x$ 的 $\mathcal{B}-$ 矩阵。

  反之,若 $\mathbb{R}^n \mapsto \mathbb{R}^n$ 的变换 $T: T(\boldsymbol x) = A \boldsymbol x$,而 $\mathcal{B}$ 是 $\mathbb{R}^n$ 的任意一个基,那么 $T$ 的 $\mathcal{B}-$ 矩阵相似于 $A$。其实,在定理 8 的证明的计算过程中已经证明若 $P$ 是以 $\mathcal{B}$ 的向量作为列构成的矩阵,那么 $[T(\boldsymbol x)]_\mathcal{B} = P^{-1}AP$。因此,所有相似于 $A$ 的矩阵的集合与变换 $\boldsymbol x \mapsto A \boldsymbol x$ 的所有矩阵表示的集合是同一集合。