[DL Note] 线性代数:矩阵运算
Contents [show]
1. 矩阵的和
若 A 和 B 都是 m×n 矩阵,则和 A+B 也是 m×n 矩阵,它的各列是 A 与 B 各列之和。仅当 A 与 B 有相同的维数时,A+B 才有定义。
例如对于 2×3 的矩阵 A 和 B
A=[397511]B=[086709]
有
A+B=[3171312110]
2. 矩阵与标量的乘法
若 r 是标量,A 是矩阵,则标量乘法 rA 是一个矩阵,它的每一列是 A 的对应列的 r 倍。与向量相同,定义 −A 为 (−1)A,而 A–B 为 A+(−1)B。例如对于上面的 A,有
2A=2[397511]=[618141022]
矩阵加法和标量乘法有如下常用性质(其中 A,B,C 是相同维数的矩阵,r 和 s 是标量):
- A+B=B+A
- (A+B)+C=A+(B+C)
- A+0=A
- r(A+B)=rA+rB
- (r+s)A=rA+sA
- r(sA)=(rs)A
3. 矩阵与向量的乘法
若 A 是 m×n 矩阵,它的各列为 a1,⋯,an。若 x 是 Rn 中的向量,则 A 与 x 的积(记为 Ax),就是 A 的各列以 x 中对应元素为权的线性组合,即
Ax=[a1a2⋯an][x1x2⋮xn]=x1a1+x2a2+⋯xnan
仅当 A 的列数等于 x 中元素个数(行数)时,Ax 才有定义。
若 A 是 m×n 矩阵,它的各列为 a1,⋯,an,而 b 属于 Rn,则矩阵方程
Ax=b
与向量方程
x1a1+x2a2+⋯+xnan=b
有相同的解集。由线性组合的概念,该矩阵方程又与增广矩阵为
[a1a2⋯anb]
的线性方程组有相同的解集。
举例来说,对于方程组
x1+2x2–x3=4−5x2+3x3=1
它等价于向量方程
x1[10]+x2[2−5]+x3[−13]=[41]
将方程左边的线性组合写成矩阵乘向量的形式,得到
[12−10−53][x1x2x3]=[41]
4. 矩阵与矩阵的乘法
若 A 是 m×n 矩阵,B 是 n×p 矩阵,则矩阵 A 和 B 的乘积为另一个 m×p 的矩阵 C,定义为
C=AB
其中
Ci,j=Ai,1B1,j+Ai,2B2,j+⋯+Ai,nBn,j=n∑k=1Ai,kBk,j
两个相同维数的向量 x 和 y 的点积可以看做是矩阵乘积 xTy,式 (4) 中 Ci,j 可以看成是 A 中第 i 行和 B 中第 j 列的点积。
对矩阵乘法的另一种直观理解是,将矩阵 B 看成是一组列向量 [b1,⋯,bp],则乘积 AB 是 m×p 矩阵,它的各列是 Ab1,⋯,Abp,即
AB=A[b1b2⋯bp]=[Ab1Ab2⋯Abp]
可见 AB 的每一列都是 A 中各列以 B 的对应列的元素为权的线性组合。AB 的行数等于 A 的行数,列数等于 B 的列数。
从线性变换的角度来看,AB 对应了这样一种线性变换:先用矩阵 B 对向量 x 做变换,得到向量 Bx,然后再用矩阵 A 对这个向量做变换,得到向量 A(Bx)。A(Bx) 是由 x 经复合映射变换得来的,将此复合映射表示为乘以一个矩阵的变换,该矩阵即为 AB,即 A(Bx)=(AB)x。假设 A 是 m×p 的矩阵,B 是 p×n 的矩阵,则有
Bx=x1b1+⋯+xpbp
A(Bx)=A(x1b1)+⋯+A(xpbp)=x1Ab1+⋯+xpAbp=[Ab1⋯Abp]x
于是矩阵 [Ab1⋯bp] 把 x 变成 A(Bx),这也是上面对矩阵乘法 AB 的定义。
设 A 为 m×n 矩阵,B 和 C 的维数使下列各式的乘积有意义,矩阵乘法有如下常用性质:
1. A(BC)=(AB)C(乘法结合律)
2. A(B+C)=AB+AC(乘法左分配律)
3. (B+C)A=BA+CA(乘法右分配律)
4. r(AB)=(rA)B=A(rB),r 为任意数
5. ImA=A=AIm(矩阵乘法的恒等式)
5. 矩阵的乘幂
若 A 是 n×n 矩阵,k 是正整数,则 Ak 表示 k 个 A 的乘积。 若 A 不是零矩阵,且 x∈Rn,则 Akx 表示 x 被 A 连续左乘 k 次。若 k=0,则 A0x 就是 x 本身,因此将 A0 解释为单位矩阵。
6. 矩阵的转置
给定 m×n 矩阵 A,则 A 的转置是一个 n×m 的矩阵,用 AT表示,它的列是由 A 的对应行构成的。
矩阵转置有如下常用性质(其中 A 与 B 表示矩阵,其维数使下列和与积有定义):
- (AT)T=A
- (A+B)T=AT+BT
- 对任意数 r,(rA)T=rAT
- (AB)T=BTAT;更一般地,若干个矩阵的乘积的转置等于它们的转置的乘积,但相乘的顺序相反。