线性代数 Cheat Sheet 1-8:线性变换介绍

  对于矩阵方程 $A \boldsymbol x = \boldsymbol b$,可以将矩阵 $A$ 看成一种对象,它通过乘法“作用”于向量 $\boldsymbol x$,产生新向量 $A \boldsymbol x = \boldsymbol b$。解方程 $A \boldsymbol x = \boldsymbol b$(假设$A$ 是 $m \times n$ 的矩阵),就是求出 $\mathbb{R}^n$ 中的所有向量 $\boldsymbol x$,它们经过乘以 $A$ 的“作用”后变为 $\mathbb{R}^m$ 中的 $\boldsymbol b$。

  由 $\mathbb{R}^n$ 到 $\mathbb{R}^m$ 的一个变换(或称函数映射)$T$ 是一个规则,它把 $\mathbb{R}^n$ 中的每个向量 $\boldsymbol x$ 对应到 $\mathbb{R}^m$ 中的一个向量 $T(\boldsymbol x)$。集 $\mathbb{R}^n$ 称为 $T$ 的定义域,$\mathbb{R}^m$ 称为 $T$ 的余定义域(或取值空间)。符号 $T: \mathbb{R}^n \rightarrow \mathbb{R}^m$ 说明 $T$ 的定义域是 $\mathbb{R}^n$,余定义域是 $\mathbb{R}^m$。对于 $\mathbb{R}^n$ 中的向量 $\boldsymbol x$,$\mathbb{R}^m$ 中的向量 $T(\boldsymbol x)$ 称为 $\boldsymbol x$(在 $T$ 作用下)的。所有像 $T(\boldsymbol x)$ 的集合称为 $T$ 的值域

1. 矩阵变换

  对于 $\mathbb{R}^n$ 中的每个 $\boldsymbol x$,$T(\boldsymbol x)$ 由 $A \boldsymbol x$ 计算得到,其中 $A$ 是 $m \times n$ 矩阵。有时将这样一个矩阵变换记为 $\boldsymbol x \rightarrow A\boldsymbol x$。当 $A$ 有 $n$ 列时,$T$ 的定义域为 $\mathbb{R}^n$;当 $A$ 的每列有 $m$ 个元素时,$T$ 的余定义域为 $\mathbb{R}^m$;$T$ 的值域为 $A$ 的列的所有线性组合的集合。

  对于线性方程组 $T(\boldsymbol x) = \boldsymbol b$,即 $A \boldsymbol x = \boldsymbol b$,其解的唯一性问题可以用矩阵变换的语言表述为:$\boldsymbol b$ 是否是 $\mathbb{R}^n$ 中唯一的 $\boldsymbol x$ 的像;其解的存在性问题,可以表述为:是否存在 $\mathbb{R}^n$ 中的 $\boldsymbol x$ 使得它的像为 $\boldsymbol b$。

2. 线性变换

  定义 当满足以下条件时,变换(或映射)$T$ 是线性的:
(i) 对 $T$ 的定义域中的一切 $\boldsymbol u, \boldsymbol v$,$T(\boldsymbol u + \boldsymbol v) = T(\boldsymbol u) + T(\boldsymbol v)$。
(ii) 对 $T$ 的定义域中的一切 $\boldsymbol u$ 和数 $c$,$T(c \boldsymbol u) = cT(\boldsymbol u)$。

  由上面定义中的两个性质,容易推出:若 $T$ 是线性变换,则

\begin{equation}
T(\boldsymbol 0) = \boldsymbol 0
\end{equation}

且对 $T$ 的定义域中的一切向量 $\boldsymbol u$ 和 $\boldsymbol v$ 以及数 $c$ 和 $d$,有:

\begin{equation}
T(c\boldsymbol u + d\boldsymbol v) = cT(\boldsymbol u) + dT(\boldsymbol v) \tag{1}
\end{equation}

  对于所有 $\boldsymbol u, \boldsymbol v$ 和 $c, d$,若一个变换满足 $(1)$,则它必是线性的。$(1)$ 式中,取 $c = d = 1$ 可得 (i),取 $d = 0$ 可得 (ii)。

  重复应用 $(1)$ 式可以得到有用的推广:

\begin{equation}
T(c_1\boldsymbol v_1 + \cdots + c_p\boldsymbol v_p) = c_1 T(\boldsymbol v_1) + \cdots + c_p T(\boldsymbol v_p) \tag{2}
\end{equation}

在工程和物理中,$(2)$ 式称为叠加原理