掌握向量:人工智能背后的数学基础(3)
7. 矩阵与向量的关系
7.1 矩阵与线性变换
向量与矩阵乘法
矩阵与向量的乘法是线性代数中的基本运算,它将一个矩阵作用于一个向量,得到一个新的向量。这一过程可以看作是对向量进行的线性变换。
设 AAA 是一个 m×nm \times nm×n 的矩阵,x⃗\vec{x}x 是一个 nnn 维列向量,则矩阵与向量的乘积 Ax⃗A\vec{x}Ax 是一个 mmm 维列向量,计算方式如下:
Ax⃗=[a11a12⋯a1na21a22⋯a2n⋮⋮⋱⋮am1am2⋯amn][x1x2⋮xn][a11x1+a12x2+⋯+a1nxna21x1+a22x2+⋯+a2nxn⋮am1x1+am2x2+⋯+amnxn] A\vec{x} = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} \begin{bmatrix} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n \\ \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n \end{bmatrix} Ax= a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn x1x2⋮xn a11x1+a12x2+⋯+a1nxna21x1+a22x2+⋯+a2nxn⋮am1x1+am2x2+⋯+amnxn
矩阵与向量乘法的每个结果元素都是矩阵的一行与向量的内积。例如,结果向量的第 iii 个元素是:
(Ax⃗)i=∑j=1naijxj=ai1x1+ai2x2+⋯+ainxn (A\vec{x})_i = \sum_{j=1}^{n} a_{ij}x_j = a_{i1}x_1 + a_{i2}x_2 + \cdots + a_{in}x_n (Ax)i=j=1∑naijxj=ai1x1+ai2x2+⋯+ainxn
矩阵与向量乘法满足以下性质:
- 分配律:A(x⃗+y⃗)=Ax⃗+Ay⃗A(\vec{x} + \vec{y}) = A\vec{x} + A\vec{y}A(x+y)=Ax+Ay
- 标量乘法:A(cx⃗)=c(Ax⃗)A(c\vec{x}) = c(A\vec{x})A(cx)=c(Ax),其中 ccc 是标量
- 矩阵乘法的结合律:(AB)x⃗=A(Bx⃗)(AB)\vec{x} = A(B\vec{x})(AB)x=A(Bx)
线性变换的几何意义
矩阵与向量的乘法可以被解释为线性变换,这是理解矩阵几何意义的关键。线性变换保持向量加法和标量乘法,即:
- T(x⃗+y⃗)=T(x⃗)+T(y⃗)T(\vec{x} + \vec{y}) = T(\vec{x}) + T(\vec{y})T(x+y)=T(x)+T(y)
- T(cx⃗)=cT(x⃗)T(c\vec{x}) = cT(\vec{x})T(cx)=cT(x)
其中 TTT 表示线性变换,x⃗\vec{x}x 和 y⃗\vec{y}y 是向量,ccc 是标量。
每个线性变换都可以用一个矩阵表示,反之亦然。矩阵 AAA 表示的线性变换 TAT_ATA 作用于向量 x⃗\vec{x}x 的结果就是 TA(x⃗)=Ax⃗T_A(\vec{x}) = A\vec{x}TA(x)=Ax。
在二维或三维空间中,线性变换有直观的几何意义:
-
缩放变换:将向量沿各坐标轴方向拉伸或压缩。例如,矩阵 [2003] \begin{bmatrix} 2 & 0 \\ 0 & 3 \end{bmatrix} [2003] 表示在 xxx 轴方向上放大 2 倍,在 yyy 轴方向上放大 3 倍。
-
旋转变换:将向量围绕原点旋转一定角度。例如,在二维平面上逆时针旋转 θ\thetaθ 角度的矩阵是 [cosθ−sinθsinθcosθ] \begin{bmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{bmatrix} [cosθsinθ−sinθcosθ]
-
剪切变换:沿某一方向拉伸向量。例如,矩阵 [1k01] \begin{bmatrix} 1 & k \\ 0 & 1 \end{bmatrix} [10k1] 表示沿 xxx 轴方向的剪切变换。
-
投影变换:将向量投影到某个子空间。例如,矩阵 [1000] \begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix} [1000] 表示将向量投影到 xxx 轴上。
-
反射变换:将向量沿某一轴或平面反射。例如,矩阵 [−1001] \begin{bmatrix} -1 & 0 \\ 0 & 1 \end{bmatrix} [−1001] 表示沿 yyy 轴反射。
矩阵的行列式可以解释为线性变换对区域面积(或体积)的缩放因子。例如,如果一个 2×22 \times 22×2 矩阵的行列式为 2,那么这个线性变换会使任何区域的面积变为原来的 2 倍。
特征值和特征向量也有重要的几何意义:特征向量表示在线性变换下只发生缩放而方向不变的向量,而特征值则是相应的缩放因子。
总的来说,矩阵是描述线性变换的强大工具,通过矩阵与向量的乘法,我们可以实现各种几何变换,这在计算机图形学、物理学、工程学等领域有广泛应用。
7.2 向量空间与子空间
向量空间的定义
向量空间(也称为线性空间)是数学中一个基本概念,它是满足一系列公理的集合,允许我们对元素进行加法和标量乘法运算。
一个向量空间 VVV 定义在某个数域 FFF 上(通常是实数域 R\mathbb{R}R 或复数域 C\mathbb{C}C),包含元素(称为向量)以及两种运算:
- 向量加法:将两个向量 u⃗,v⃗∈V\vec{u}, \vec{v} \in Vu,v∈V 映射到一个新向量 u⃗+v⃗∈V\vec{u} + \vec{v} \in Vu+v∈V
- 标量乘法:将一个标量 c∈Fc \in Fc∈F 和一个向量 v⃗∈V\vec{v} \in Vv∈V 映射到一个新向量 cv⃗∈Vc\vec{v} \in Vcv∈V
一个集合 VVV 要成为数域 FFF 上的向量空间,必须满足以下公理:
对于任意向量 u⃗,v⃗,w⃗∈V\vec{u}, \vec{v}, \vec{w} \in Vu,v,w∈V 和任意标量 a,b∈Fa, b \in Fa,b∈F:
- 加法封闭性:u⃗+v⃗∈V\vec{u} + \vec{v} \in Vu+v∈V
- 加法交换律:u⃗+v⃗=v⃗+u⃗\vec{u} + \vec{v} = \vec{v} + \vec{u}u+v=v+u
- 加法结合律:(u⃗+v⃗)+w⃗=u⃗+(v⃗+w⃗)(\vec{u} + \vec{v}) + \vec{w} = \vec{u} + (\vec{v} + \vec{w})(u+v)+w=u+(v+w)
- 加法零元素:存在 0⃗∈V\vec{0} \in V0∈V,使得对所有 v⃗∈V\vec{v} \in Vv∈V,有 v⃗+0⃗=v⃗\vec{v} + \vec{0} = \vec{v}v+0=v
- 加法逆元素:对每个 v⃗∈V\vec{v} \in Vv∈V,存在 −v⃗∈V-\vec{v} \in V−v∈V,使得 v⃗+(−v⃗)=0⃗\vec{v} + (-\vec{v}) = \vec{0}v+(−v)=0
- 标量乘法封闭性:av⃗∈Va\vec{v} \in Vav∈V
- 标量乘法对向量加法的分配律:a(u⃗+v⃗)=au⃗+av⃗a(\vec{u} + \vec{v}) = a\vec{u} + a\vec{v}a(u+v)=au+av
- 标量乘法对标量加法的分配律:(a+b)v⃗=av⃗+bv⃗(a + b)\vec{v} = a\vec{v} + b\vec{v}(a+b)v=av+bv
- 标量乘法的结合律:a(bv⃗)=(ab)v⃗a(b\vec{v}) = (ab)\vec{v}a(bv)=(ab)v
- 标量乘法的单位元:1v⃗=v⃗1\vec{v} = \vec{v}1v=v
常见的向量空间例子包括:
- Rn\mathbb{R}^nRn:nnn 维实向量空间
- Cn\mathbb{C}^nCn:nnn 维复向量空间
- PnP_nPn:次数不超过 nnn 的多项式空间
- Mm×nM_{m \times n}Mm×n:m×nm \times nm×n 矩阵的空间
- C[a,b]C[a,b]C[a,b]:区间 [a,b][a,b][a,b] 上的连续函数空间
子空间的定义
子空间是向量空间 VVV 的一个非空子集 WWW,它在向量空间的运算下封闭,即它自身也构成一个向量空间。
形式化地说,若 VVV 是数域 FFF 上的向量空间,则 VVV 的一个非空子集 WWW 是 VVV 的子空间,当且仅当:
- 向量加法封闭:对任意 u⃗,v⃗∈W\vec{u}, \vec{v} \in Wu,v∈W,有 u⃗+v⃗∈W\vec{u} + \vec{v} \in Wu+v∈W
- 标量乘法封闭:对任意 v⃗∈W\vec{v} \in Wv∈W 和任意标量 c∈Fc \in Fc∈F,有 cv⃗∈Wc\vec{v} \in Wcv∈W
需要注意的是,如果 WWW 满足上述两个条件,则它必然包含零向量 0⃗\vec{0}0(可以通过取 c=0c = 0c=0 证明)。
每个向量空间至少有两个子空间:
- 平凡子空间 0⃗{\vec{0}}0(只包含零向量的子空间)
- 整个向量空间 VVV 本身
子空间的判定
判断一个集合 WWW 是否为向量空间 VVV 的子空间,我们需要验证以下三个条件:
- 非空性:W≠∅W \neq \emptysetW=∅,即 WWW 中至少有一个元素
- 加法封闭性:对任意 u⃗,v⃗∈W\vec{u}, \vec{v} \in Wu,v∈W,有 u⃗+v⃗∈W\vec{u} + \vec{v} \in Wu+v∈W
- 标量乘法封闭性:对任意 v⃗∈W\vec{v} \in Wv∈W 和任意标量 c∈Fc \in Fc∈F,有 cv⃗∈Wc\vec{v} \in Wcv∈W
实际上,我们可以将条件简化为:
- 包含零向量:0⃗∈W\vec{0} \in W0∈W
- 加法封闭性:对任意 u⃗,v⃗∈W\vec{u}, \vec{v} \in Wu,v∈W,有 u⃗+v⃗∈W\vec{u} + \vec{v} \in Wu+v∈W
- 标量乘法封闭性:对任意 v⃗∈W\vec{v} \in Wv∈W 和任意标量 c∈Fc \in Fc∈F,有 cv⃗∈Wc\vec{v} \in Wcv∈W
或者更进一步简化为:
- 线性组合封闭性:对任意 u⃗,v⃗∈W\vec{u}, \vec{v} \in Wu,v∈W 和任意标量 a,b∈Fa, b \in Fa,b∈F,有 au⃗+bv⃗∈Wa\vec{u} + b\vec{v} \in Wau+bv∈W
这个条件综合了加法封闭性和标量乘法封闭性,同时也保证了零向量的存在(取 a=b=0a = b = 0a=b=0)。
子空间的例子与判定
-
R3\mathbb{R}^3R3 中的平面:过原点的平面是 R3\mathbb{R}^3R3 的子空间。例如,平面 ax+by+cz=0ax + by + cz = 0ax+by+cz=0(其中至少一个系数非零)是 R3\mathbb{R}^3R3 的二维子空间。
判定:任取平面上两点 u⃗,v⃗\vec{u}, \vec{v}u,v,它们满足 au⃗x+bu⃗y+cu⃗z=0a\vec{u}_x + b\vec{u}_y + c\vec{u}_z = 0aux+buy+cuz=0 和 av⃗x+bv⃗y+cv⃗z=0a\vec{v}_x + b\vec{v}_y + c\vec{v}_z = 0avx+bvy+cvz=0。对于任意标量 α,β\alpha, \betaα,β,线性组合 αu⃗+βv⃗\alpha\vec{u} + \beta\vec{v}αu+βv 也满足:
a(αu⃗x+βv⃗x)+b(αu⃗y+βv⃗y)+c(αu⃗z+βv⃗z)=α(au⃗x+bu⃗y+cu⃗z)+β(av⃗x+bv⃗y+cv⃗z)=0a(\alpha\vec{u}_x + \beta\vec{v}_x) + b(\alpha\vec{u}_y + \beta\vec{v}_y) + c(\alpha\vec{u}_z + \beta\vec{v}_z) = \alpha(a\vec{u}_x + b\vec{u}_y + c\vec{u}_z) + \beta(a\vec{v}_x + b\vec{v}_y + c\vec{v}_z) = 0a(αux+βvx)+b(αuy+βvy)+c(αuz+βvz)=α(aux+buy+cuz)+β(avx+bvy+cvz)=0
因此,平面上点的任意线性组合仍在平面上,满足子空间的条件。
-
R3\mathbb{R}^3R3 中的直线:过原点的直线是 R3\mathbb{R}^3R3 的子空间。例如,直线 r⃗=tv⃗\vec{r} = t\vec{v}r=tv(其中 v⃗\vec{v}v 是非零向量,ttt 是参数)是 R3\mathbb{R}^3R3 的一维子空间。
-
零空间(核):矩阵 AAA 的零空间是所有满足 Ax⃗=0⃗A\vec{x} = \vec{0}Ax=0 的向量 x⃗\vec{x}x 的集合,记为 Null(A)\text{Null}(A)Null(A) 或 Ker(A)\text{Ker}(A)Ker(A)。它是相应向量空间的子空间。
判定:若 u⃗,v⃗∈Null(A)\vec{u}, \vec{v} \in \text{Null}(A)u,v∈Null(A),则 Au⃗=0⃗A\vec{u} = \vec{0}Au=0 和 Av⃗=0⃗A\vec{v} = \vec{0}Av=0。对于任意标量 α,β\alpha, \betaα,β,有:
A(αu⃗+βv⃗)=αAu⃗+βAv⃗=α0⃗+β0⃗=0⃗A(\alpha\vec{u} + \beta\vec{v}) = \alpha A\vec{u} + \beta A\vec{v} = \alpha\vec{0} + \beta\vec{0} = \vec{0}A(αu+βv)=αAu+βAv=α0+β0=0
因此,αu⃗+βv⃗∈Null(A)\alpha\vec{u} + \beta\vec{v} \in \text{Null}(A)αu+βv∈Null(A),满足子空间条件。
-
列空间:矩阵 AAA 的列空间是 AAA 的列向量的所有线性组合构成的集合,记为 Col(A)\text{Col}(A)Col(A) 或 Range(A)\text{Range}(A)Range(A)。它是相应向量空间的子空间。
-
解空间:齐次线性方程组 Ax⃗=0⃗A\vec{x} = \vec{0}Ax=0 的解集是相应向量空间的子空间。而非齐次线性方程组 Ax⃗=b⃗A\vec{x} = \vec{b}Ax=b (其中 b⃗≠0⃗\vec{b} \neq \vec{0}b=0)的解集不是子空间,因为它不包含零向量,也不满足加法封闭性。
子空间的一些性质
-
交集:若 W1W_1W1 和 W2W_2W2 是向量空间 VVV 的子空间,则它们的交集 W1∩W2W_1 \cap W_2W1∩W2 也是 VVV 的子空间。
-
和:若 W1W_1W1 和 W2W_2W2 是向量空间 VVV 的子空间,则它们的和 W1+W2=w⃗1+w⃗2:w⃗1∈W1,w⃗2∈W2W_1 + W_2 = {\vec{w}_1 + \vec{w}_2 : \vec{w}_1 \in W_1, \vec{w}_2 \in W_2}W1+W2=w1+w2:w1∈W1,w2∈W2 也是 VVV 的子空间。
-
直和:若 W1∩W2=0⃗W_1 \cap W_2 = {\vec{0}}W1∩W2=0,则 W1+W2W_1 + W_2W1+W2 称为直和,记为 W1⊕W2W_1 \oplus W_2W1⊕W2。此时,W1+W2W_1 + W_2W1+W2 中的每个向量都可以唯一地表示为 w⃗1+w⃗2\vec{w}_1 + \vec{w}_2w1+w2,其中 w⃗1∈W1,w⃗2∈W2\vec{w}_1 \in W_1, \vec{w}_2 \in W_2w1∈W1,w2∈W2。
以上是向量空间与子空间的基本概念和判定方法。这些概念是线性代数的基础,对于理解线性变换、矩阵表示和许多其他高级概念都至关重要。
7.3 特征值与特征向量
特征值的概念
特征值和特征向量是线性代数中描述矩阵作为线性变换作用效果的重要概念。简单来说,特征向量是在线性变换下方向保持不变的非零向量,而特征值则表示特征向量在该变换下的缩放因子。
设 AAA 是一个 n×nn \times nn×n 的方阵,如果存在一个非零向量 v⃗\vec{v}v 和一个标量 λ\lambdaλ,使得:
Av⃗=λv⃗A\vec{v} = \lambda\vec{v}Av=λv
则称 λ\lambdaλ 是矩阵 AAA 的一个特征值,而 v⃗\vec{v}v 是对应于特征值 λ\lambdaλ 的特征向量。
从几何角度看,这意味着当线性变换 AAA 作用于特征向量 v⃗\vec{v}v 时,得到的结果向量与原向量平行,仅在大小上缩放了 λ\lambdaλ 倍。如果 λ>1\lambda > 1λ>1,则向量被拉长;如果 0<λ<10 < \lambda < 10<λ<1,则向量被压缩;如果 λ<0\lambda < 0λ<0,则向量方向反转并缩放 ∣λ∣|\lambda|∣λ∣ 倍。
特征值的性质
-
行列式与特征值:矩阵 AAA 的行列式等于其所有特征值的乘积,即 det(A)=∏i=1nλi\det(A) = \prod_{i=1}^{n} \lambda_idet(A)=∏i=1nλi。
-
迹与特征值:矩阵 AAA 的迹(主对角线元素之和)等于其所有特征值的和,即 tr(A)=∑i=1nλi\text{tr}(A) = \sum_{i=1}^{n} \lambda_itr(A)=∑i=1nλi。
-
特征多重性:特征值可能重复出现,其重复次数称为特征值的代数重数。对应于一个特征值的线性无关特征向量的最大数目称为几何重数,几何重数不大于代数重数。
-
相似矩阵:相似矩阵具有相同的特征值,即如果 B=P−1APB = P^{-1}APB=P−1AP,则 AAA 和 BBB 有相同的特征值。
特征向量的计算方法
计算矩阵 AAA 的特征值和特征向量的标准步骤如下:
步骤1:求解特征多项式方程
特征值满足特征多项式方程:
det(A−λI)=0\det(A - \lambda I) = 0det(A−λI)=0
其中 III 是单位矩阵,det\detdet 表示行列式。
展开这个行列式,我们得到一个关于 λ\lambdaλ 的 nnn 次多项式方程,称为特征多项式方程。求解这个方程得到特征值 λ1,λ2,…,λn\lambda_1, \lambda_2, \ldots, \lambda_nλ1,λ2,…,λn(可能有重复)。
步骤2:对每个特征值求对应的特征向量
对于每个特征值 λi\lambda_iλi,求解齐次线性方程组:
(A−λiI)v⃗=0⃗(A - \lambda_i I)\vec{v} = \vec{0}(A−λiI)v=0
这个方程组的非零解就是对应于特征值 λi\lambda_iλi 的特征向量。
解这个方程组通常采用以下步骤:
- 计算矩阵 A−λiIA - \lambda_i IA−λiI
- 将矩阵化为阶梯形式(使用高斯消元法)
- 求解得到的方程组的基础解系
例子:计算 2×22 \times 22×2 矩阵的特征值和特征向量
考虑矩阵 A=[3113]A = \begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix}A=[3113]。
步骤1:计算特征多项式并求解特征值。
det(A−λI)=det[3−λ113−λ]=(3−λ)2−1=(3−λ)2−1=λ2−6λ+8=0\det(A - \lambda I) = \det\begin{bmatrix} 3-\lambda & 1 \\ 1 & 3-\lambda \end{bmatrix} = (3-\lambda)^2 - 1 = (3-\lambda)^2 - 1 = \lambda^2 - 6\lambda + 8 = 0det(A−λI)=det[3−λ113−λ]=(3−λ)2−1=(3−λ)2−1=λ2−6λ+8=0
求解二次方程得到特征值 λ1=4\lambda_1 = 4λ1=4 和 λ2=2\lambda_2 = 2λ2=2。
步骤2:对于特征值 λ1=4\lambda_1 = 4λ1=4,求解方程组 (A−4I)v⃗=0⃗(A - 4I)\vec{v} = \vec{0}(A−4I)v=0:
[−111−1][v1v2]=[00]\begin{bmatrix} -1 & 1 \\ 1 & -1 \end{bmatrix} \begin{bmatrix} v_1 \\ v_2 \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix}[−111−1][v1v2]=[00]
这给出方程 −v1+v2=0-v_1 + v_2 = 0−v1+v2=0,即 v1=v2v_1 = v_2v1=v2。所以,对应于 λ1=4\lambda_1 = 4λ1=4 的特征向量形式为 v⃗1=t[11]\vec{v}_1 = t\begin{bmatrix} 1 \\ 1 \end{bmatrix}v1=t[11],其中 ttt 是任意非零实数。
对于特征值 λ2=2\lambda_2 = 2λ2=2,求解方程组 (A−2I)v⃗=0⃗(A - 2I)\vec{v} = \vec{0}(A−2I)v=0:
[1111][v1v2]=[00]\begin{bmatrix} 1 & 1 \\ 1 & 1 \end{bmatrix} \begin{bmatrix} v_1 \\ v_2 \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix}[1111][v1v2]=[00]
这给出方程 v1+v2=0v_1 + v_2 = 0v1+v2=0,即 v2=−v1v_2 = -v_1v2=−v1。所以,对应于 λ2=2\lambda_2 = 2λ2=2 的特征向量形式为 v⃗2=s[1−1]\vec{v}_2 = s\begin{bmatrix} 1 \\ -1 \end{bmatrix}v2=s[1−1],其中 sss 是任意非零实数。
因此,矩阵 AAA 的特征值和对应的特征向量是:
- 特征值 λ1=4\lambda_1 = 4λ1=4,特征向量 v⃗1=[11]\vec{v}_1 = \begin{bmatrix} 1 \\ 1 \end{bmatrix}v1=[11](取 t=1t = 1t=1)
- 特征值 λ2=2\lambda_2 = 2λ2=2,特征向量 v⃗2=[1−1]\vec{v}_2 = \begin{bmatrix} 1 \\ -1 \end{bmatrix}v2=[1−1](取 s=1s = 1s=1)
特征值分解的应用
特征值分解,也称为谱分解,是将矩阵表示为其特征值和特征向量的组合。对于可对角化的矩阵 AAA,其特征值分解为:
A=PDP−1A = PDP^{-1}A=PDP−1
其中 DDD 是对角矩阵,对角线上的元素是 AAA 的特征值;PPP 是可逆矩阵,其列是 AAA 的对应特征向量。
特征值分解有许多重要应用:
1. 矩阵幂的计算
对于可对角化矩阵 A=PDP−1A = PDP^{-1}A=PDP−1,其 kkk 次幂可以表示为:
Ak=(PDP−1)k=PDkP−1A^k = (PDP^{-1})^k = PD^kP^{-1}Ak=(PDP−1)k=PDkP−1
这大大简化了矩阵幂的计算,因为对角矩阵的幂只需对其对角元素求幂:
Dk=[λ1k0⋯00λ2k⋯0⋮⋮⋱⋮00⋯λnk]D^k = \begin{bmatrix} \lambda_1^k & 0 & \cdots & 0 \\ 0 & \lambda_2^k & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n^k \end{bmatrix}Dk= λ1k0⋮00λ2k⋮0⋯⋯⋱⋯00⋮λnk
2. 解耦线性微分方程组
考虑线性微分方程组:
dx⃗dt=Ax⃗\frac{d\vec{x}}{dt} = A\vec{x}dtdx=Ax
如果 AAA 可对角化为 A=PDP−1A = PDP^{-1}A=PDP−1,则通过变量替换 y⃗=P−1x⃗\vec{y} = P^{-1}\vec{x}y=P−1x,方程变为:
dy⃗dt=Dy⃗\frac{d\vec{y}}{dt} = D\vec{y}dtdy=Dy
这是一个解耦的方程组,每个方程只涉及一个变量,可以分别求解。
3. 主成分分析(PCA)
在数据分析中,协方差矩阵的特征值和特征向量用于主成分分析。特征向量指示数据的主要方向(主成分),而特征值表示这些方向上的方差大小。
4. 图像处理和压缩
在图像处理中,可以使用特征值分解进行图像压缩。通过保留与最大特征值对应的特征向量,可以得到原始图像的低秩近似。
5. 量子力学
在量子力学中,哈密顿算符的特征值对应于系统的能量水平,而特征向量(或特征函数)对应于系统的状态。
6. 振动分析
在工程中,特征值和特征向量用于分析结构的自然频率和振动模式。特征值表示自然频率的平方,而特征向量表示振动模式。
7. 谷歌的PageRank算法
网页排名算法利用特征向量来确定网页的重要性。具体地,PageRank向量是网页链接矩阵的主特征向量(对应于最大特征值的特征向量)。
8. 马尔可夫链的稳态分布
对于马尔可夫链,其转移矩阵的特征值可以用来确定收敛速度,而对应于特征值 1 的特征向量给出了马尔可夫链的稳态分布。
总结
特征值和特征向量提供了理解和分析线性变换的强大工具。它们不仅在理论上重要,而且在实际应用中广泛使用,从数据分析到工程设计,从量子力学到网络分析。特征值分解使我们能够将复杂的线性变换分解为简单的缩放操作,从而简化计算和分析。
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐


所有评论(0)