写给计算机系同学的李群与李代数（三）：矩阵指数与李群-李代数对应

我们将聚焦于矩阵指数映射（Matrix Exponential），它是连接李群与李代数的桥梁。通过公式推导、具体例子和几何解释，我们将揭示李代数如何生成李群元素，以及这种对应在计算机科学中的重要性。

阿正的梦工坊

1145人浏览 · 2025-04-12 13:53:20

阿正的梦工坊 · 2025-04-12 13:53:20 发布

矩阵指数与李群-李代数对应

写给计算机系同学的李群与李代数（一）：从旋转矩阵到抽象群
 写给计算机系同学的李群与李代数（二）：李代数的结构——以 so(n) 为例

在前两篇文章中，我们认识了李群（Lie Group）与李代数（Lie Algebra）的基本概念，并深入探讨了特殊正交群（Special Orthogonal Group, SO(n)）的李代数 $\text{so}(n)$ ，即由反对称矩阵（Skew-Symmetric Matrix）构成的向量空间。今天，我们将聚焦于矩阵指数映射（Matrix Exponential），它是连接李群与李代数的桥梁。通过公式推导、具体例子和几何解释，我们将揭示李代数如何生成李群元素，以及这种对应在计算机科学中的重要性。

矩阵指数映射（Matrix Exponential）的定义

矩阵指数映射是李群与李代数关系的核心。对于一个 $\times n$ 矩阵 $A$ ，其指数定义为：
$e^A = \sum_{k=0}^\infty \frac{A^k}{k!} = I + A + \frac{A^2}{2!} + \frac{A^3}{3!} + \cdots$
其中 $I$ 是单位矩阵。这个定义类似于标量指数函数 $e^x$ 的泰勒展开，但现在操作的是矩阵。对于李代数 $\mathfrak{g}$ 的元素 $A$ ，矩阵指数 $e^A$ 通常生成对应的李群 $G$ 中的元素。

为什么矩阵指数重要？

李代数描述了李群在单位元（Identity Element，例如单位矩阵）附近的“无穷小变换”（Infinitesimal Transformation）。矩阵指数映射将这些“速度”转化为“位置”：

李代数 $\mathfrak{g}$ ：表示局部线性化的变换（类似角速度）。
李群 $G$ ：表示全局的变换（类似旋转矩阵）。
矩阵指数 $e^A$ ：从 $\mathfrak{g}$ 到 $G$ 的桥梁。

让我们通过具体例子来探索这一过程。

矩阵指数的性质

矩阵指数映射有几个关键性质，帮助我们理解李群与李代数的动态关系：

单参数子群（One-Parameter Subgroup）：
对于李代数中的元素 $A$ ，映射 $\mapsto e^{tA}$ 形成李群中的一条曲线，满足：
$e^{tA} e^{sA} = e^{(t+s)A}$
这表明 $e^{tA}$ 是一个群同态，描述了沿 $A$ 方向的连续变换。
非交换性（Non-Commutativity）：
一般情况下，矩阵指数不满足 $e^{A+B} = e^A e^B$ ，除非 $[A, B] = A B - B A = 0$ 。这反映了李群变换的非交换性，例如三维旋转的顺序依赖。
局部近似：
对于小的 $t$ ，有：
$e^{tA} \approx I + tA$
这表明李代数元素 $t A$ 是李群元素 $e^{tA}$ 在单位元附近的线性近似。

接下来，我们以 $\text{so}(3)$ 和 $\text{se}(3)$ 为例，详细推导矩阵指数的计算和意义。

以 $\text{so}(3)$ 为例：Rodrigues 公式

$\text{so}(3)$ 是特殊正交群 SO(3) 的李代数，由 $\times 3$ 反对称矩阵组成。任意 $\text{so}(3)$ 元素可以写为：
$\begin{bmatrix} 0 & -\omega_3 & \omega_2 \\ \omega_3 & 0 & -\omega_1 \\ -\omega_2 & \omega_1 & 0 \end{bmatrix}$
其中 $\omega = (\omega_1, \omega_2, \omega_3)$ 是一个三维向量。矩阵 $B$ 表示绕轴 $\omega$ 的无穷小旋转，旋转速度为 $|\omega|$ 。

推导 Rodrigues 公式

我们希望计算 $e^{t B}$ ，它应生成 SO(3) 中的旋转矩阵。注意到 $B$ 的特殊结构，我们定义：
$\hat{\omega} = \frac{\omega}{|\omega|}, \quad \theta = t |\omega|, \quad \tilde{B} = \frac{B}{|\omega|}$
这样， $e^{t B} = e^{\theta \tilde{B}}$ ，其中 $\tilde{B}$ 满足 $\tilde{B}^3 = -\tilde{B}$ （稍后验证）。计算 $\tilde{B}$ 的幂：
$\tilde{B} = \begin{bmatrix} 0 & -\hat{\omega}_3 & \hat{\omega}_2 \\ \hat{\omega}_3 & 0 & -\hat{\omega}_1 \\ -\hat{\omega}_2 & \hat{\omega}_1 & 0 \end{bmatrix}$
定义向量 $\omega$ 与矩阵 $B$ 的关系：对于任意向量 $v$ ，有：
$\omega \times v$
因此， $B$ 对应于叉积运算。计算 $B^2$ ：
$B^2 v = B (B v) = B (\omega \times v) = \omega \times (\omega \times v) = (\omega \cdot v) \omega - (\omega \cdot \omega) v = -|\omega|^2 v + (\omega \cdot v) \omega$
对于单位向量 $\hat{\omega}$ ， $|\hat{\omega}| = 1$ ，所以：
$\tilde{B}^2 v = -v + (\hat{\omega} \cdot v) \hat{\omega}$
投影到 $\hat{\omega}$ 方向的部分满足 $\tilde{B} (\hat{\omega} \cdot v) \hat{\omega} = 0$ ，因此：
$\tilde{B}^2 = -I + \hat{\omega} \hat{\omega}^T$
再计算：
$\tilde{B}^3 = \tilde{B} \tilde{B}^2 = \tilde{B} (-I + \hat{\omega} \hat{\omega}^T) = -\tilde{B}$
因为 $\tilde{B} \hat{\omega} = 0$ 。有了这些，我们计算指数：
$e^{\theta \tilde{B}} = I + \theta \tilde{B} + \frac{\theta^2}{2!} \tilde{B}^2 + \frac{\theta^3}{3!} \tilde{B}^3 + \cdots$
利用 $\tilde{B}^3 = -\tilde{B}$ ， $\tilde{B}^4 = \tilde{B}^2$ ，整理得：
$e^{\theta \tilde{B}} = I + \left( \theta - \frac{\theta^3}{3!} + \cdots \right) \tilde{B} + \left( \frac{\theta^2}{2!} - \frac{\theta^4}{4!} + \cdots \right) \tilde{B}^2$
识别出：
$\sin\theta = \theta - \frac{\theta^3}{3!} + \cdots, \quad 1 - \cos\theta = \frac{\theta^2}{2!} - \frac{\theta^4}{4!} + \cdots$
代入 $\tilde{B}^2 = -I + \hat{\omega} \hat{\omega}^T$ ：
$e^{\theta \tilde{B}} = I + \sin\theta \tilde{B} + (1 - \cos\theta) \tilde{B}^2$
将 $\tilde{B}$ 和 $\tilde{B}^2$ 代回，得到 Rodrigues 公式（Rodrigues Formula）：
$e^{\theta \tilde{B}} = I + \sin\theta \tilde{B} + (1 - \cos\theta) (\tilde{B}^2)$
对于原始矩阵 $\theta \tilde{B}$ ，我们有：
$e^{t B} = I + \sin(t |\omega|) \frac{B}{|\omega|} + (1 - \cos(t |\omega|)) \left( \frac{B}{|\omega|} \right)^2$
这表示绕轴 $\omega/|\omega|$ 旋转角度 $|\omega|$ 的旋转矩阵。

例子：绕 z 轴旋转

取 $\omega = (0, 0, 1)$ ，则：
$\begin{bmatrix} 0 & -1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix}$
应用 Rodrigues 公式， $\theta = t$ ， $\tilde{B} = B$ ：
$e^{t B} = I + \sin t B + (1 - \cos t) B^2$
计算 $B^2$ ：
$B^2 = \begin{bmatrix} -1 & 0 & 0 \\ 0 & -1 & 0 \\ 0 & 0 & 0 \end{bmatrix}$
代入：
$e^{t B} = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix} + \sin t \begin{bmatrix} 0 & -1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix} + (1 - \cos t) \begin{bmatrix} -1 & 0 & 0 \\ 0 & -1 & 0 \\ 0 & 0 & 0 \end{bmatrix}$
整理得：
$e^{t B} = \begin{bmatrix} \cos t & -\sin t & 0 \\ \sin t & \cos t & 0 \\ 0 & 0 & 1 \end{bmatrix}$
这正是绕 z 轴旋转 $t$ 弧度的矩阵，与前文一致。

几何意义

Rodrigues 公式表明， $\text{so}(3)$ 中的矩阵 $B$ 编码了旋转轴和角速度， $e^{t B}$ 将其转化为具体的旋转。几何上，李代数提供了一个线性空间，描述所有可能的旋转“方向”，而指数映射将这些方向“展开”为李群中的曲线。

以 $\text{se}(3)$ 为例：刚体变换

欧几里得群（Euclidean Group, SE(3)）描述三维空间的刚体变换（旋转加平移），其元素为 $\times 4$ 矩阵：
$\begin{bmatrix} R & t \\ 0 & 1 \end{bmatrix}, \quad R \in \text{SO}(3), \quad t \in \mathbb{R}^3$
其李代数 $\text{se}(3)$ 由矩阵构成：
$\begin{bmatrix} B & v \\ 0 & 0 \end{bmatrix}, \quad B \in \text{so}(3), \quad v \in \mathbb{R}^3$
其中 $B$ 表示角速度， $v$ 表示线速度。

推导指数映射

考虑 $\text{se}(3)$ 元素：
$\begin{bmatrix} B & v \\ 0 & 0 \end{bmatrix}$
计算 $e^{t A}$ ：
$e^{t A} = \sum_{k=0}^\infty \frac{(t A)^k}{k!}$
由于 $A$ 的分块结构，计算 $t A)^k$ ：
$A^2 = \begin{bmatrix} B & v \\ 0 & 0 \end{bmatrix} \begin{bmatrix} B & v \\ 0 & 0 \end{bmatrix} = \begin{bmatrix} B^2 & B v \\ 0 & 0 \end{bmatrix}$
一般地：
$A^k = \begin{bmatrix} B^k & B^{k-1} v \\ 0 & 0 \end{bmatrix}$
指数为：
$e^{t A} = \begin{bmatrix} e^{t B} & \int_0^t e^{s B} v \, ds \\ 0 & 1 \end{bmatrix}$
其中 $e^{t B} \in \text{SO}(3)$ 是旋转矩阵。积分部分计算：
$\int_0^t e^{s B} v \, ds$
若 $\theta \tilde{B}$ ，使用 Rodrigues 公式：
$e^{s B} = I + \sin(s \theta) \tilde{B} + (1 - \cos(s \theta)) \tilde{B}^2$
积分得：
$\int_0^t e^{s B} v \, ds = \left( I t + \frac{1 - \cos(t \theta)}{\theta} \tilde{B} + \frac{t \theta - \sin(t \theta)}{\theta^2} \tilde{B}^2 \right) v$
最终：
$e^{t A} = \begin{bmatrix} e^{t B} & V v \\ 0 & 1 \end{bmatrix}$
其中 $V$ 是与旋转相关的矩阵。这表示一个螺旋运动（Screw Motion）：先旋转后平移。

例子：机器人运动

假设机器人绕 z 轴旋转 $\theta = t$ ，同时沿 z 轴平移 $v = (0, 0, t)$ ：
$\begin{bmatrix} 0 & -1 & 0 & 0 \\ 1 & 0 & 0 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 \end{bmatrix}$
计算 $e^{t A}$ （推导略，类似前述），结果为：
$e^{t A} = \begin{bmatrix} \cos t & -\sin t & 0 & 0 \\ \sin t & \cos t & 0 & 0 \\ 0 & 0 & 1 & t \\ 0 & 0 & 0 & 1 \end{bmatrix}$
这描述了机器人绕 z 轴旋转 $t$ 弧度，同时沿 z 轴平移 $t$ 个单位。

几何意义

$\text{se}(3)$ 的指数映射将角速度和线速度组合为刚体变换，几何上对应于螺旋运动。 $B$ 控制旋转轴， $v$ 控制平移方向， $e^{t A}$ 将这些“速度”转化为具体的位姿。

非交换性：Baker-Campbell-Hausdorff 公式

矩阵指数的非交换性是李代数的重要特征。一般情况下：
$e^A e^B \neq e^{A+B}$
Baker-Campbell-Hausdorff 公式（BCH Formula）提供了近似：
$e^A e^B = e^C, \quad C \approx A + B + \frac{1}{2} [A, B] + \text{高阶项}$
对于小矩阵 $A, B$ ：
$e^A e^B \approx e^{A + B + \frac{1}{2} [A, B]}$
这表明李括号 $[A, B]$ 量化了非交换效应。

例子：旋转的非交换

在 $\text{so}(3)$ 中，取：
$\theta B_1, \quad B = \phi B_2$
其中 $B_1, B_2$ 是 $\text{so}(3)$ 的基。计算 $\theta \phi [B_1, B_2] = \theta \phi B_3$ 。BCH 公式表明：
$e^{\theta B_1} e^{\phi B_2} \approx e^{\theta B_1 + \phi B_2 + \frac{1}{2} \theta \phi B_3}$
这意味着先绕 x 轴旋转 $\theta$ ，再绕 y 轴旋转 $\phi$ ，会引入一个额外的绕 z 轴的旋转。