线性代数 Cheat Sheet 1-2:行化简与阶梯形矩阵
矩阵中至少包含一个非零元素的行称为非零行,非零行中最左边的非零元素称为先导元素。
定义 若矩阵具有以下三个性质:
1. 每一非零行都在每一零行之上。
2. 某一行的先导元素所在的列位于前一行先导元素的右边。
3. 某一先导元素所在列的下方元素都是零。
则称该矩阵为阶梯形(或行阶梯形)矩阵。
若一个阶梯形矩阵还满足以下性质:
4. 每一非零行的先导元素都是 1。
5. 每一先导元素 1 是该元素所在列中唯一的非零元素。
则称该矩阵为简化阶梯形(或简化行阶梯形)矩阵。
任何非零都矩阵可以行化简(即通过初等行变换)变为阶梯形矩阵,但用不同的方法可以化为不同的阶梯形矩阵。一个矩阵只能化为唯一的简化阶梯形矩阵。
定理 1(简化阶梯形矩阵的唯一性)每个矩阵行等价于唯一的简化阶梯形矩阵。
1. 主元位置
当矩阵通过行变换从阶梯形化为简化阶梯形时,先导元素的位置不变。因为简化阶梯形时唯一的,故当给定矩阵化为任何一个阶梯形时,先导元素总是在相同的位置上,对应于简化阶梯形中的先导元素 1。
定义 矩阵中的主元位置是 $A$ 中对应于它的阶梯型中先导元素 1 的位置。主元列是 $A$ 的含有主元位置的列。
2. 行化简算法
行化简算法的步骤如下:
1. 由最左的非零列开始,找到一个最左侧的先导元素作为主元。
2. 通过对换变换将该元素所在行移动到第一行。
3. 通过倍加变换将主元下面的元素变为 0。
4. 将剩下的行看做一个子矩阵,在其上应用以上三个步骤,直到没有非零行为止。
5. 由最右边的主元开始,把每个主元上方的各元素变为 0,并通过倍乘变换将该主元变成 1。
以上 1~4 步称为前向步骤,得到阶梯形矩阵;第 5 步称为后向步骤,得到简化阶梯形。
在第 1 步中,计算机程序通常选择一列中绝对值最大的元素作为主元,以减少计算中的舍入误差,称为部分主元法。
3. 线性方程组的解
对线性方程组的增广矩阵进行行化简,可以得到方程组解集的一种显式表示法。例如对于如下已经化为简化阶梯形的增广矩阵
\begin{bmatrix}
1 & 0 & -5 & 1 \\
0 & 1 & 1 & 4 \\
0 & 0 & 0 & 0
\end{bmatrix}
其对应的线性方程组为
\begin{align}
x_1 – 5x_3 &= 1 \\
x_2 + x_3 &= 4 \\
0 &= 0
\end{align}
对应于主元列的变量(如 $x_1$ 和 $x_2$)称为基本变量,其他变量(如 $x_3$)称为自由变量。只要一个线性方程组是相容的,则其解集就可以显式表示,只需把方程的简化阶梯形解出来,再用自由变量表示基本变量即可。上面方程组的解集为
\begin{equation}
\begin{cases}
x_1 = 1 + 5x_3 \\
x_2 = 4 – x_3 \\
x_3 是自由变量
\end{cases} \tag{1}
\end{equation}
$x_3$ 是自由变量,它可以取任意的值。
上面的解称为方程组的通解,它给出了所有解的显式表示。
4. 解集的参数表示
解集的表示式 $(1)$ 中自由变量作为参数,称为解集的参数表示。解方程组就是要求出解集的这种参数表示,或确定它无解。
当一个方程组相容且具有自由变量时,它的解集具有多种参数表示,通常使用自由变量作为参数来表示解集。当方程组不相容时,解集是空集,无论方程组是否有自由变量,解集无参数表示。
5. 存在与唯一性问题
定理 2(存在与唯一性定理)线性方程组相容的充要条件是增广矩阵的最右列不是主元列,即增广矩阵的阶梯形没有形如
\begin{equation}
\begin{bmatrix}
0 & \cdots & 0 & b
\end{bmatrix}
,\; b \neq 0
\end{equation}
的行,若线性方程组相容,它的解集可能有两种情况:(i) 当没有自由变量时,有唯一解;(ii) 当至少有一个自由变量时,有无穷多解。
定理 2 的最后一句也可以表述成,如果线性方程组是相容的,则解是唯一的当且仅当系数矩阵的每一列都是主元列。
若线性方程组的个数少于未知数的个数,则称之为欠定方程组。如果一个欠定方程组是相容的,则它有无穷多解。
若线性方程组的个数多于未知数的个数,则称之为超定方程组。假设有 $m$ 个方程和 $n$ 个未知数,则有 $m > n$,此时当有 $m – n$ 个方程式剩余 $n$ 个方程的线性组合时,方程组相容。
欠定方程组和超定方程组都可能存在不相容的情况。
通过行化简算法解线性方程组的步骤:
1. 写出方程组的增广矩阵。
2. 应用行化简算法把增广矩阵化为阶梯形,确认方程组是否有解,若无解则停止,否则进行下一步。
3. 继续行化简算法得到简化阶梯形。
4. 写出由第 3 步所得矩阵所对应的方程组。
5. 把第 4 步得到的每个非零方程改写为用任意自由变量表示其基本变量的形式。