机器学习数学基础：12.矩阵基础知识

矩阵基础知识

m0_65104419

1699人浏览 · 2025-02-05 19:55:18

m0_65104419 · 2025-02-05 19:55:18 发布

矩阵运算全解析

一、矩阵的基本概念

（一）本质

矩阵本质上是一个按照矩形阵列排列的数表。在数学领域，特别是线性代数中，矩阵常被用于描述和处理线性方程组。例如，对于线性方程组：
$\begin{cases} 2x + 3y \ = 8 \\ 4x - 5y \ = - 1 \end{cases}$
我们可以将其系数提取出来构成一个 $2 \times 2$ 的矩阵 $[234−5]\begin{bmatrix}2&3\\4& - 5\end{bmatrix}$ ，将系数与常数项一起构成一个 $2 \times 3$ 的增广矩阵 $[2384−5−1]\begin{bmatrix}2&3&8\\4& - 5& - 1\end{bmatrix}$ 。通过对这些矩阵进行特定的变换和运算，可以帮助我们求解方程组，这是矩阵在实际应用中的一种常见方式。

（二）表示方法

矩阵由 $M$ 行 $N$ 列的数组成，通常用大写字母如 $A$ 、 $B$ 、 $C$ 等表示。矩阵中的元素用 $A_{ij}$ 表示，其中 $i$ 代表元素所在的行（ $\ = 1,2,\cdots,M$ ）， $j$ 代表元素所在的列（ $\ = 1,2,\cdots,N$ ）。例如，在一个 $3 \times 4$ 的矩阵 $A$ 中：
$A\ =\begin{bmatrix} a_{11}&a_{12}&a_{13}&a_{14}\\ a_{21}&a_{22}&a_{23}&a_{24}\\ a_{31}&a_{32}&a_{33}&a_{34} \end{bmatrix}$
$a_{23}$ 就表示第 $2$ 行第 $3$ 列的元素，它是矩阵 $A$ 中的一个具体数值。

二、矩阵的加法运算

（一）运算前提条件

只有当两个矩阵具有相同的行数和列数时，它们才能进行加法运算，即对于矩阵 $A\ =(a_{ij})$ 和矩阵 $B\ =(b_{ij})$ ，只有当 $A$ 和 $B$ 都是 $m \times n$ 矩阵（ $m$ 表示行数， $n$ 表示列数）时， $A$ 与 $B$ 才能相加。

（二）运算规则

矩阵 $A$ 与 $B$ 相加得到的矩阵 $C\ =(c_{ij})$ ，其中 $c_{ij}\ =a_{ij}+b_{ij}$ ， $\ = 1,2,\cdots,m$ ， $\ = 1,2,\cdots,n$ 。简单来说，就是将两个矩阵对应位置的元素相加，得到的结果作为和矩阵对应位置的元素。

例如，有矩阵 $=[1234]A\ =\begin{bmatrix}1&2\\3&4\end{bmatrix}$ ，矩阵 $=[5678]B\ =\begin{bmatrix}5&6\\7&8\end{bmatrix}$ ，因为 $A$ 和 $B$ 都是 $2 \times 2$ 的矩阵，所以可以进行加法运算，其结果为：

$\ = A + B\ =\begin{bmatrix}1 + 5&2 + 6\\3 + 7&4 + 8\end{bmatrix}\ =\begin{bmatrix}6&8\\10&12\end{bmatrix}$

（三）特殊性质

交换律： $B\ =B + A$ 。
结合律： $B)+C\ =A+(B + C)$ 。

其中， $A$ 、 $B$ 、 $C$ 是具有相同行数和列数的矩阵。

三、矩阵的减法运算

（一）运算前提条件

与加法运算相同，只有两个矩阵行数和列数都一致时，才能进行减法运算，即矩阵 $A$ 和 $B$ 都为 $m \times n$ 矩阵时， $A - B$ 才有意义。

（二）运算规则

矩阵 $A$ 减去 $B$ 得到的矩阵 $D\ =(d_{ij})$ ，其中 $d_{ij}\ =a_{ij}-b_{ij}$ ， $\ = 1,2,\cdots,m$ ， $\ = 1,2,\cdots,n$ 。也就是将两个矩阵对应位置的元素相减，差值作为差矩阵对应位置的元素。

例如，若 $=[9753]A\ =\begin{bmatrix}9&7\\5&3\end{bmatrix}$ ， $=[4321]B\ =\begin{bmatrix}4&3\\2&1\end{bmatrix}$ ，由于它们都是 $2 \times 2$ 矩阵，可做减法：

$\ = A - B\ =\begin{bmatrix}9 - 4&7 - 3\\5 - 2&3 - 1\end{bmatrix}\ =\begin{bmatrix}5&4\\3&2\end{bmatrix}$

（三）特殊性质

矩阵减法不满足交换律，一般情况下 $\neq B - A$ 。

四、矩阵的乘法运算

（一）运算前提条件

矩阵乘法有严格的要求：只有当第一个矩阵的列数与第二个矩阵的行数相等时，这两个矩阵才能相乘。我们把这个相等的数称为 “内标”。假设矩阵 $A$ 是 $m \times n$ 的矩阵（即 $m$ 行 $n$ 列），矩阵 $B$ 是 $n \times p$ 的矩阵（即 $n$ 行 $p$ 列），此时 $A$ 的列数 $n$ 和 $B$ 的行数 $n$ 相等，那么 $A$ 和 $B$ 可以进行乘法运算，记作 $A B$ ，结果是一个 $m \times p$ 的矩阵。例如，若 $A$ 是 $2 \times 3$ 的矩阵， $B$ 是 $3 \times 4$ 的矩阵，因为 $A$ 的列数 $3$ 等于 $B$ 的行数 $3$ ，所以 $A B$ 可以运算，结果是一个 $2 \times 4$ 的矩阵；若 $A$ 是 $3 \times 2$ 的矩阵， $B$ 是 $4 \times 3$ 的矩阵，由于 $A$ 的列数 $2$ 不等于 $B$ 的行数 $4$ ，则 $A B$ 无法进行乘法运算。

（二）运算规则

设矩阵 $A \ =(a_{ij})$ 是 $m \times n$ 的矩阵，矩阵 $B \ =(b_{ij})$ 是 $n \times p$ 的矩阵，它们的乘积 $C \ = AB \ =(c_{ij})$ 是一个 $m \times p$ 的矩阵。其中 $C$ 中第 $i$ 行第 $j$ 列的元素 $c_{ij}$ 是通过 $A$ 的第 $i$ 行元素与 $B$ 的第 $j$ 列对应元素相乘后再求和得到的，用公式表示为：
$=ai1b1j+ai2b2j+⋯+ainbnjc_{ij}\ =\sum_{k \ = 1}^{n}a_{ik}b_{kj}\ =a_{i1}b_{1j}+a_{i2}b_{2j}+\cdots+a_{in}b_{nj}$
例如，设 $=[1234]A\ =\begin{bmatrix}1&2\\3&4\end{bmatrix}$ ， $=[5678]B\ =\begin{bmatrix}5&6\\7&8\end{bmatrix}$ 。计算 $A B$ 时：
- $c_{11}\ =1×5 + 2×7 \ = 5 + 14 \ = 19$ ；
- $c_{12}\ =1×6 + 2×8 \ = 6 + 16 \ = 22$ ；
- $c_{21}\ =3×5 + 4×7 \ = 15 + 28 \ = 43$ ；
- $c_{22}\ =3×6 + 4×8 \ = 18 + 32 \ = 50$ 。
所以 $=[19224350]AB\ =\begin{bmatrix}19&22\\43&50\end{bmatrix}$ 。

（三）特殊性质

不具有交换律：在一般情况下，矩阵乘法不满足交换律，即 $AB≠BAAB\neq BA$ 。原因有以下几点：
- 从运算前提看， $A B$ 要求 $A$ 的列数等于 $B$ 的行数，而 $B A$ 要求 $B$ 的列数等于 $A$ 的行数，当 $A$ 和 $B$ 的行列数不满足特定对称关系时，可能出现 $A B$ 能运算但 $B A$ 不能运算的情况。例如，若 $A$ 是 $2 \times 3$ 的矩阵， $B$ 是 $3 \times 4$ 的矩阵， $A B$ 是 $2 \times 4$ 的数学符号矩阵，而 $B A$ 无法运算。
- 即使 $A B$ 和 $B A$ 都能运算，它们结果矩阵的行数和列数也可能不同。比如 $A$ 是 $2 \times 3$ 的矩阵， $B$ 是 $3 \times 2$ 的矩阵， $A B$ 是 $2 \times 2$ 的矩阵， $B A$ 是 $3 \times 3$ 的矩阵。
- 就算 $A B$ 和 $B A$ 结果矩阵的行列数相同，对应位置的元素也不一定相等。例如 $=[1234]A\ =\begin{bmatrix}1&2\\3&4\end{bmatrix}$ ， $=[5678]B\ =\begin{bmatrix}5&6\\7&8\end{bmatrix}$ ， $=[19224350]AB\ =\begin{bmatrix}19&22\\43&50\end{bmatrix}$ ，而 $=[23343146]BA\ =\begin{bmatrix}23&34\\31&46\end{bmatrix}$ ，显然 $AB≠BAAB\neq BA$ 。
不具有消去率：在矩阵乘法中，若 $\ = 0$ （ $0$ 表示零矩阵），不能得出 $\ = 0$ 或 $\ = 0$ 。也就是说，存在非零矩阵 $A$ 和 $B$ ，使得它们的乘积为零矩阵。例如，设 $=[1000]A\ =\begin{bmatrix}1&0\\0&0\end{bmatrix}$ ， $=[0001]B\ =\begin{bmatrix}0&0\\0&1\end{bmatrix}$ ，则 $=[0000]AB\ =\begin{bmatrix}0&0\\0&0\end{bmatrix}$ ，但 $A$ 和 $B$ 都不是零矩阵。

三、转置矩阵

（一）定义

对于矩阵 $A$ ，将其行和列进行互换操作后得到的新矩阵，称为 $A$ 的转置矩阵，记为 $A^T$ 。例如，若 $=[123456]A\ =\begin{bmatrix}1&2&3\\4&5&6\end{bmatrix}$ ，那么 $=[142536]A^T\ =\begin{bmatrix}1&4\\2&5\\3&6\end{bmatrix}$ 。可以看到，原矩阵 $A$ 的第 $1$ 行变成了 $A^T$ 的第 $1$ 列，原矩阵 $A$ 的第 $2$ 行变成了 $A^T$ 的第 $2$ 列。

（二）性质

再转置性质：对转置矩阵再取转置，结果会变回原矩阵，即 $A^T)^T \ = A$ 。从定义角度理解，对 $A$ 进行一次转置得到 $A^T$ ，再对 $A^T$ 进行一次行和列的互换操作，就又回到了最初的矩阵 $A$ 。
加法转置性质：对于两个同型矩阵（行数和列数都相同） $A$ 和 $B$ ， $A + B)^T \ = A^T + B^T$ 。设 $A\ =(a_{ij})$ ， $B\ =(b_{ij})$ 都是 $m×nm\times n$ 的矩阵， $A + B\ =(a_{ij}+b_{ij})$ ， $A + B)^T$ 中第 $i$ 行第 $j$ 列的元素是 $A + B$ 中第 $j$ 行第 $i$ 列的元素 $a_{ji}+b_{ji}$ ； $A^T\ =(a_{ji})$ ， $B^T\ =(b_{ji})$ ， $A^T + B^T$ 中第 $i$ 行第 $j$ 列的元素也是 $a_{ji}+b_{ji}$ ，所以 $A + B)^T \ = A^T + B^T$ 。
数乘转置性质：若 $A$ 是矩阵， $λ\lambda$ 是常数，则 $=λAT(\lambda A)^T\ =\lambda A^T$ 。设 $A\ =(a_{ij})$ 是 $m×nm\times n$ 的矩阵， $=(λaij)\lambda A\ =(\lambda a_{ij})$ ， $(λA)T(\lambda A)^T$ 中第 $i$ 行第 $j$ 列的元素是 $λA\lambda A$ 中第 $j$ 行第 $i$ 列的元素 $λaji\lambda a_{ji}$ ； $λAT\lambda A^T$ 中第 $i$ 行第 $j$ 列的元素同样是 $λaji\lambda a_{ji}$ ，所以 $=λAT(\lambda A)^T\ =\lambda A^T$ 。
乘积转置性质：当两个矩阵 $A$ 和 $B$ 可以相乘时， $AB)^T \ = B^T A^T$ 。设 $A$ 是 $m×nm\times n$ 的矩阵， $B$ 是 $n×pn\times p$ 的矩阵， $A B$ 是 $m×pm\times p$ 的矩阵。 $AB)^T$ 是 $p×mp\times m$ 的矩阵，其第 $i$ 行第 $j$ 列的元素是 $A B$ 中第 $j$ 行第 $i$ 列的元素 $=1najkbki\sum_{k \ = 1}^{n}a_{jk}b_{ki}$ ； $B^T$ 是 $p×np\times n$ 的矩阵， $A^T$ 是 $n×mn\times m$ 的矩阵， $B^T A^T$ 是 $p×mp\times m$ 的矩阵，其第 $i$ 行第 $j$ 列的元素为 $=1nbkiajk\sum_{k \ = 1}^{n}b_{ki}a_{jk}$ ，二者相等，所以 $AB)^T \ = B^T A^T$ 。

四、伴随矩阵

（一）定义

对于一个 $n$ 阶方阵 $A$ （即行数和列数都为 $n$ 的矩阵），其伴随矩阵记为 $A^*$ 。伴随矩阵 $A^*$ 的构建过程如下：
首先，对于矩阵 $A$ 中的每个元素 $a_{ij}$ ，求出它的代数余子式 $A_{ij}$ 。在 $n$ 阶行列式中，把元素 $a_{ij}$ 所在的第 $i$ 行和第 $j$ 列上的所有元素都划去，留下来的 $n - 1$ 阶行列式叫做元素 $a_{ij}$ 的余子式，记作 $M_{ij}$ ，而 $A_{ij}\ =(-1)^{i + j}M_{ij}$ 就称为元素 $a_{ij}$ 的代数余子式。
然后，由这些代数余子式构成一个新的矩阵 $[A11A21⋯An1A12A22⋯An2⋮⋮⋱⋮A1nA2n⋯Ann]\begin{bmatrix}A_{11}&A_{21}&\cdots&A_{n1}\\A_{12}&A_{22}&\cdots&A_{n2}\\\vdots&\vdots&\ddots&\vdots\\A_{1n}&A_{2n}&\cdots&A_{nn}\end{bmatrix}$ ，这个矩阵再进行转置操作，就得到了伴随矩阵 $A^*$ ，即 $=[A11A12⋯A1nA21A22⋯A2n⋮⋮⋱⋮An1An2⋯Ann]TA^*\ =\begin{bmatrix}A_{11}&A_{12}&\cdots&A_{1n}\\A_{21}&A_{22}&\cdots&A_{2n}\\\vdots&\vdots&\ddots&\vdots\\A_{n1}&A_{n2}&\cdots&A_{nn}\end{bmatrix}^T$ 。

（二）性质

行列式性质：伴随矩阵的行列式等于原矩阵行列式的 $n - 1$ 次方，即 $A^*| \ = |A|^{n - 1}$ 。例如，对于一个 $3$ 阶方阵 $A$ ， $A^*| \ = |A|^2$ 。这一性质可以通过行列式的展开定理和代数余子式的相关性质进行推导证明。
数乘行列式性质：若 $A$ 是 $n$ 阶矩阵， $λ\lambda$ 是常数，则 $=λn∣A∣|\lambda A|\ =\lambda^n|A|$ 。这是因为数乘矩阵时，矩阵的每一个元素都乘以该常数 $λ\lambda$ ，在计算行列式时，根据行列式的性质，每一行（列）提出一个公因子 $λ\lambda$ ， $n$ 阶行列式就会提出 $n$ 个 $λ\lambda$ ，所以 $=λn∣A∣|\lambda A|\ =\lambda^n|A|$ 。
乘积行列式性质：对于两个 $n$ 阶方阵 $A$ 和 $B$ ， $\ = |A|\times|B|$ 。这个性质可以通过行列式的乘法规则以及矩阵乘法的运算规则进行证明。它表明两个方阵乘积的行列式等于它们各自行列式的乘积，在计算一些复杂矩阵的行列式时，可以利用这一性质简化计算过程。