2 量子力学基础

2.1 线性代数

2.1.1 基和线性无关性

定义1:生成集

向量空间的生成集是向量集∣v1⟩,...,∣vn⟩\left | v_1 \right \rangle ,...,\left | v_n \right \ranglev1,...,vn,则该向量空间中任意一个向量∣v⟩\left | v \right \ranglev都可以写成该向量集中向量的线性组合∣v⟩=∑iai∣vi⟩\left | v \right \rangle = {\textstyle \sum_{i}} a_i\left | v_i \right \ranglev=iaivi

exp. 向量空间C2\mathbb{C}^2C2的生成集是
∣v1⟩≡[10];∣v2⟩≡[01](2.5) \left | v_1 \right \rangle \equiv \begin{bmatrix} 1\\0 \end{bmatrix}; \left | v_2 \right \rangle \equiv \begin{bmatrix} 0\\1 \end{bmatrix}(2.5) v1[10];v2[01](2.5)
那么向量空间C2\mathbb{C}^2C2中的任意向量
∣v⟩≡[a1a2](2.6) \left | v \right \rangle \equiv \begin{bmatrix} a_1\\a_2 \end{bmatrix}(2.6) v[a1a2](2.6)
都可以写成向量∣v1⟩\left | v_1 \right \ranglev1∣v2⟩\left | v_2 \right \ranglev2的线性组合∣v⟩=a1∣v1⟩+a2∣v2⟩\left | v \right \rangle = a_1\left | v_1 \right \rangle+a_2\left | v_2 \right \ranglev=a1v1+a2v2。称向量∣v1⟩\left | v_1 \right \ranglev1∣v2⟩\left | v_2 \right \ranglev2张成了向量空间C2\mathbb{C}^2C2

定义2:线性无关

对于非零向量集∣v1⟩,...,∣vn⟩\left | v_1 \right \rangle ,...,\left | v_n \right \ranglev1,...,vn,若存在一个复数集合a1,...,ana_1,...,a_na1,...,an,其中至少一个ai≠0a_i\ne 0ai=0,使得
a1∣v1⟩+a2∣v2⟩+...+an∣vn⟩=0(2.9) a_1\left | v_1 \right \rangle+a_2\left | v_2 \right \rangle+...+a_n\left | v_n \right \rangle=0(2.9) a1v1+a2v2+...+anvn=0(2.9)
则称其是线性相关的,否则是线性无关的。

2.1.2 线性算子和矩阵

定义1:线性算子

向量空间VVVWWW之间的线性算子定义为对输入具有线性性质的映射A:V→WA:V\to WA:VW
A(∑iai∣vi⟩)=∑iaiA(∣vi⟩)(2.10) A\left ( \sum_{i}a_i\left | v_i \right \rangle \right ) = \sum_{i}a_iA\left ( \left | v_i \right \rangle \right ) (2.10) A(iaivi)=iaiA(vi)(2.10)
定义在线性空间VVV上的线性算子AAA,意味着AAA是一个从VVVVVV的线性算子。

  • 恒等算子IVI_VIV:对任意的向量∣v⟩\left | v \right \ranglevIV(∣v⟩)=∣v⟩I_V(\left | v \right \rangle)=\left | v \right \rangleIV(v)=v
  • 零算子000:零算子把所有向量映射为零向量,即0(∣v⟩)=00(\left | v \right \rangle)=00(v)=0
  • 复合算子BABABABBBAAA的复合,定义为(BA)(∣v⟩)≡B(A(∣v⟩))(BA)(\left | v \right \rangle)\equiv B(A(\left | v \right \rangle))(BA)(v)B(A(v))
定义2:矩阵表示

线性算子和矩阵完全等价。假设A:V→WA:V\to WA:VW是向量空间VVVWWW之间的线性算子。∣v1⟩,...,∣vm⟩\left | v_1 \right \rangle ,...,\left | v_m \right \ranglev1,...,vmVVV的一组基,∣w1⟩,...,∣wn⟩\left | w_1 \right \rangle ,...,\left | w_n \right \ranglew1,...,wnWWW的一组基。则对1,...,m1,...,m1,...,m中任意的jjj存在复数A1jA_{1j}A1jAnjA_{nj}Anj,使得
A∣vj⟩=∑iAij∣wi⟩(2.12) A \left | v_j \right \rangle=\sum_iA_{ij}\left | w_i \right \rangle(2.12) Avj=iAijwi(2.12)
称元素为AijA_{ij}Aij的矩阵形成了算子AAA的一个矩阵表示。

2.1.3 泡利矩阵

四个泡利矩阵如图2.2

在这里插入图片描述

2.1.4 内积

定义1:内积的符号表示

∣v⟩\left | v \right \ranglev∣w⟩\left | w \right \ranglew的内积记为(∣v⟩,∣w⟩)(\left | v \right \rangle,\left | w \right \rangle )(v,w),标准量子力学记号是⟨v∣w⟩\left \langle v | w \right \ranglevw,其中⟨v∣\left \langle v \right |v∣v⟩\left | v \right \ranglev的对偶向量。

定义2:内积

一个从V×VV \times VV×V到复数空间C\mathbb{C}C的函数(⋅,⋅)(\cdot, \cdot)(,),如果满足下面的要求

  1. (⋅,⋅)(\cdot, \cdot)(,)对于第二个参数是线性的:
    (∣v⟩,∑iλi∣wi⟩)=∑iλi(∣v⟩,∣wi⟩)(2.13) \left(|v\rangle, \sum_{i} \lambda_{i}\left|w_{i}\right\rangle\right)=\sum_{i} \lambda_{i}\left(|v\rangle,\left|w_{i}\right\rangle\right)(2.13) (v,iλiwi)=iλi(v,wi)(2.13)

  2. (∣v⟩,∣w⟩)=(∣w⟩,∣v⟩)∗(|v\rangle,|w\rangle)=(|w\rangle,|v\rangle)^{*}(v,w⟩)=(w,v)

  3. (∣v⟩,∣v⟩)≥0(|v\rangle,|v\rangle) \geq 0(v,v⟩)0,当且仅当∣v⟩=0|v\rangle=0v=0时等式成立

则称函数(⋅,⋅)(\cdot, \cdot)(,)是一个内积。Cn\mathbb{C}^{n}Cn中的内积定义为
((y1,…,yn),(z1,…,zn))≡∑iyi∗zi=[y1∗…yn∗][z1⋮zn] \left(\left(y_{1}, \ldots, y_{n}\right),\left(z_{1}, \ldots, z_{n}\right)\right) \equiv \sum_{i} y_{i}^{*} z_{i}=\left[y_{1}^{*} \ldots y_{n}^{*}\right]\left[\begin{array}{c} z_{1} \\ \vdots \\ z_{n} \end{array}\right] ((y1,,yn),(z1,,zn))iyizi=[y1yn] z1zn
称定义了内积的向量空间为内积空间=希尔伯特空间。

定义3:内积的性质
  1. 如果向量∣w⟩\left | w \right \ranglew∣v⟩\left | v \right \ranglev的内积为0,则它们是正交的
  2. 向量∣v⟩\left | v \right \ranglev范数∥∣v⟩∥≡⟨v∣v⟩\left \| \left | v \right \rangle \right \| \equiv \sqrt{\left \langle v | v \right \rangle }vvv
  3. 向量∣v⟩\left | v \right \ranglev若满足∥∣v⟩∥=1\left \| \left | v \right \rangle \right \| =1v=1,则∣v⟩\left | v \right \ranglev正规化的。对任意非零向量∣v⟩\left | v \right \ranglev∣v⟩/∥∣v⟩∥\left | v \right \rangle/\left \| \left | v \right \rangle \right \|v/v∣v⟩\left | v \right \ranglev的正规化。
  4. 对于一个向量集∣i⟩\left | i \right \ranglei,其中iii是指标,如果集合中的每一个向量都是单位向量,且不同向量之间是正交的,即⟨i∣j⟩=δij\left \langle i | j \right \rangle =\delta _{ij}ij=δij,那么称该向量集为标准正交
  5. ⟨Φ∣Ψ⟩=⟨Ψ∣Φ⟩‾\langle \Phi | \Psi \rangle = \overline{\langle \Psi | \Phi \rangle}Φ∣Ψ=Ψ∣Φ,量子态用复数表示的情况。

考虑两个量子态 ∣Ψ⟩\lvert \Psi \rangleΨ∣Φ⟩\lvert \Phi \rangleΦ,它们位于二维复 Hilbert 空间。假设这两个态用列向量表示如下:
∣Ψ⟩=(α1α2),∣Φ⟩=(β1β2) \lvert \Psi \rangle = \begin{pmatrix} \alpha_1 \\ \alpha_2 \end{pmatrix}, \quad \lvert \Phi \rangle = \begin{pmatrix} \beta_1 \\ \beta_2 \end{pmatrix} Ψ=(α1α2),Φ=(β1β2)
其中 α1,α2,β1,β2\alpha_1, \alpha_2, \beta_1, \beta_2α1,α2,β1,β2 是复数。

计算 ⟨Ψ∣Φ⟩\langle \Psi | \Phi \rangleΨ∣Φ:根据内积的定义,⟨Ψ∣Φ⟩\langle \Psi | \Phi \rangleΨ∣Φ∣Ψ⟩\lvert \Psi \rangleΨ∣Φ⟩\lvert \Phi \rangleΦ 的内积,它是 ∣Ψ⟩\lvert \Psi \rangleΨ 的共轭转置与 ∣Φ⟩\lvert \Phi \rangleΦ 的矩阵乘积。具体表示为:
⟨Ψ∣Φ⟩=(α1‾α2‾)(β1β2) \langle \Psi | \Phi \rangle = \begin{pmatrix} \overline{\alpha_1} & \overline{\alpha_2} \end{pmatrix} \begin{pmatrix} \beta_1 \\ \beta_2 \end{pmatrix} Ψ∣Φ=(α1α2)(β1β2)
得到:
⟨Ψ∣Φ⟩=α1‾β1+α2‾β2 \langle \Psi | \Phi \rangle = \overline{\alpha_1} \beta_1 + \overline{\alpha_2} \beta_2 Ψ∣Φ=α1β1+α2β2
其中,α1‾\overline{\alpha_1}α1α2‾\overline{\alpha_2}α2 表示 α1\alpha_1α1α2\alpha_2α2 的复共轭。

计算 ⟨Φ∣Ψ⟩\langle \Phi | \Psi \rangleΦ∣Ψ:同样地,⟨Φ∣Ψ⟩\langle \Phi | \Psi \rangleΦ∣Ψ∣Φ⟩\lvert \Phi \rangleΦ∣Ψ⟩\lvert \Psi \rangleΨ 的内积,它是 ∣Φ⟩\lvert \Phi \rangleΦ 的共轭转置与 ∣Ψ⟩\lvert \Psi \rangleΨ 的矩阵乘积。具体表示为:
⟨Φ∣Ψ⟩=(β1‾β2‾)(α1α2) \langle \Phi | \Psi \rangle = \begin{pmatrix} \overline{\beta_1} & \overline{\beta_2} \end{pmatrix} \begin{pmatrix} \alpha_1 \\ \alpha_2 \end{pmatrix} Φ∣Ψ=(β1β2)(α1α2)
展开矩阵乘法后,我们得到:
⟨Φ∣Ψ⟩=β1‾α1+β2‾α2 \langle \Phi | \Psi \rangle = \overline{\beta_1} \alpha_1 + \overline{\beta_2} \alpha_2 Φ∣Ψ=β1α1+β2α2

验证共轭对称性:

现在我们分别得到了 ⟨Ψ∣Φ⟩\langle \Psi | \Phi \rangleΨ∣Φ⟨Φ∣Ψ⟩\langle \Phi | \Psi \rangleΦ∣Ψ

  • ⟨Ψ∣Φ⟩=α1‾β1+α2‾β2\langle \Psi | \Phi \rangle = \overline{\alpha_1} \beta_1 + \overline{\alpha_2} \beta_2Ψ∣Φ=α1β1+α2β2
  • ⟨Φ∣Ψ⟩=β1‾α1+β2‾α2\langle \Phi | \Psi \rangle = \overline{\beta_1} \alpha_1 + \overline{\beta_2} \alpha_2Φ∣Ψ=β1α1+β2α2

注意到这两个表达式之间的关系:⟨Φ∣Ψ⟩\langle \Phi | \Psi \rangleΦ∣Ψ 实际上是 ⟨Ψ∣Φ⟩\langle \Psi | \Phi \rangleΨ∣Φ 的复共轭,因为根据复数的乘法规则:

(α1‾β1+α2‾β2)‾=β1‾α1+β2‾α2 \overline{(\overline{\alpha_1} \beta_1 + \overline{\alpha_2} \beta_2)} = \overline{\beta_1} \alpha_1 + \overline{\beta_2} \alpha_2 (α1β1+α2β2)=β1α1+β2α2
因此:
⟨Φ∣Ψ⟩=⟨Ψ∣Φ⟩‾ \langle \Phi | \Psi \rangle = \overline{\langle \Psi | \Phi \rangle} Φ∣Ψ=Ψ∣Φ

定义4:格拉姆-施密特正交化方法

假设∣w1⟩,...,∣wn⟩\left | w_1 \right \rangle ,...,\left | w_n \right \ranglew1,...,wn是某个内积向量空间VVV的一组基,首先定义∣v1⟩≡∣w1⟩/∥∣w1⟩∥\left | v_1 \right \rangle \equiv \left | w_1 \right \rangle/\left \| \left | w_1 \right \rangle \right \|v1w1/w1,并且对于1≤k≤d−11\le k\le d-11kd1,定义
∣vk+1⟩≡∣wk+1⟩−∑i=1k⟨vi∣wk+1⟩∣vi⟩∥∣wk+1⟩−∑i=1k⟨vi∣wk+1⟩∣vi⟩∥(2.17) \left|v_{k+1}\right\rangle \equiv \frac{\left|w_{k+1}\right\rangle-\sum_{i=1}^{k}\left\langle v_{i} \mid w_{k+1}\right\rangle\left|v_{i}\right\rangle}{\|\left|w_{k+1}\right\rangle-\sum_{i=1}^{k}\left\langle v_{i} \mid w_{k+1}\right\rangle\left|v_{i}\right\rangle \|}(2.17) vk+1wk+1i=1kviwk+1viwk+1i=1kviwk+1vi(2.17)
可以得到∣v1⟩,...,∣vn⟩\left | v_1 \right \rangle ,...,\left | v_n \right \ranglev1,...,vn是一组标准正交集,是向量空间VVV的一组基。

定义5:内积的矩阵表示

∣w⟩=∑iwi∣i⟩,∣v⟩=∑jvj∣j⟩|w\rangle=\sum_{i} w_{i}|i\rangle,|v\rangle=\sum_{j} v_{j}|j\ranglew=iwii,v=jvjj∣w⟩|w\ranglew∣v⟩|v\ranglev在某组标准正交基下的表示,则由于⟨i∣j⟩=δij\left \langle i | j \right \rangle =\delta _{ij}ij=δij
⟨v∣w⟩=(∑ivi∣i⟩,∑jwj∣j⟩)=∑ijvi∗wjδij=∑ivi∗wi(2.18)=[v1∗…vn∗][w1⋮wn](2.19) \begin{aligned} \langle v \mid w\rangle & =\left(\sum_{i} v_{i}|i\rangle, \sum_{j} w_{j}|j\rangle\right)=\sum_{i j} v_{i}^{*} w_{j} \delta_{i j}=\sum_{i} v_{i}^{*} w_{i} (2.18)\\ & =\left[v_{1}^{*} \ldots v_{n}^{*}\right]\left[\begin{array}{c} w_{1} \\ \vdots \\ w_{n} \end{array}\right](2.19) \end{aligned} vw=(ivii,jwjj)=ijviwjδij=iviwi(2.18)=[v1vn] w1wn (2.19)

  • 只要向量的矩阵表示按同一组标准正交基给出,两个向量的内积就等于向量矩阵表示的内积。
定义6:外积

假设∣v⟩\left | v \right \ranglev是内积空间VVV的一个向量,∣w⟩\left | w \right \ranglew是内积空间WWW的一个向量。定义∣w⟩⟨v∣\left | w \right \rangle \left \langle v \right |wv为从VVVWWW的一个线性算子,作用为
(∣w⟩⟨v∣)(∣v′⟩)≡∣w⟩⟨v∣v′⟩≡⟨v∣v′⟩∣w⟩(2.20) (\left | w \right \rangle \left \langle v \right | )(\left | v' \right \rangle)\equiv \left | w \right \rangle\left \langle v | v' \right \rangle \equiv \left \langle v | v' \right \rangle \left | w \right \rangle(2.20) (wv)(v)wvvvvw(2.20)

  • 完备性关系:∑i∣i⟩⟨i∣=I\sum_{i}\left | i \right \rangle \left \langle i \right | =Iiii=I

  • 完备性关系应用:给出任意算子的表示方式。假设A:V→WA:V\to WA:VW是一个线性算子,∣vi⟩\left | v_i \right \rangleviVVV的一组标准正交基,∣wi⟩\left | w_i \right \ranglewiWWW的一组标准正交基,运用两次完备性关系可以得到
    A=IWAIV(2.23)   =∑ij∣wj⟩⟨wj∣A∣vi⟩⟨vi∣(2.24)   =∑ij⟨wj∣A∣vi⟩∣wj⟩⟨vi∣(2.25) \begin{array}{l} A =I_{W} A I_{V} (2.23)\\ \text{ }\text{ }\text{ }=\sum_{i j}\left|w_{j}\right\rangle\left\langle w_{j}|A| v_{i}\right\rangle\left\langle v_{i}\right| (2.24)\\ \text{ }\text{ }\text{ }=\sum_{i j}\left\langle w_{j}|A| v_{i}\right\rangle\left|w_{j}\right\rangle\left\langle v_{i}\right|(2.25) \end{array} A=IWAIV(2.23)   =ijwjwjAvivi(2.24)   =ijwjAviwjvi(2.25)

定义7:柯西-施瓦茨不等式

对于任意两个向量∣v⟩\left | v \right \ranglev∣w⟩\left | w \right \ranglew∣⟨v∣w⟩∣2≤⟨v∣v⟩⟨w∣w⟩\left | \left \langle v | w \right \rangle \right | ^2\le \left \langle v | v \right \rangle \left \langle w | w \right \ranglevw2vvww。当且仅当∣v⟩\left | v \right \ranglev∣w⟩\left | w \right \ranglew是线性相关的,即对于某个标量zzz∣v⟩=z∣w⟩\left | v \right \rangle=z\left | w \right \ranglev=zw

2.1.5 特征向量和特征值

定义1:特征向量(本征向量)

向量空间中线性算子AAA的特征向量是一个非零向量∣v⟩\left | v \right \ranglev,使得A∣v⟩=v∣v⟩A\left | v \right \rangle= v\left | v\right \rangleAv=vv

定义2:特征值(本征值)

其中vvv是一个复数,称为与AAA的特征向量∣v⟩\left | v \right \ranglev对应的特征值。

  • 特征函数定义为c(λ)≡det⁡∣A−λI∣c(\lambda )\equiv \det\left | A-\lambda I \right |c(λ)detAλI,其中det⁡\detdet是矩阵的行列式函数,特征函数仅依赖于算子AAA,而不依赖于AAA的特殊矩阵表示
  • 本征方程c(λ)=0c(\lambda)=0c(λ)=0的解是算子AAA的特征值,任意算子AAA至少有一个特征值和一个对应的特征向量
  • 特征空间是以vvv为特征值的向量的集合。它是AAA作用的向量空间的子空间
定义3:算子的对角表示

算子AAA在向量空间VVV的对角表示为A=∑iλi∣i⟩⟨i∣A= {\textstyle \sum_{i}} \lambda _{i} \left | i \right \rangle \left \langle i \right |A=iλiii,其中对应特征值λi\lambda _{i}λi的向量∣i⟩\left | i \right \ranglei组成AAA的特征向量的标准正交基。如果一个算子有对角表示,则称其为可对角化的。

定义4:泡利矩阵的对角表示

Z=[100−1]=∣0⟩⟨0∣−∣1⟩⟨1∣ Z=\left[\begin{array}{rr} 1 & 0 \\ 0 & -1 \end{array}\right]=|0\rangle\langle 0|-| 1\rangle\langle 1| Z=[1001]=∣00∣∣11∣

X=[0110]=12(∣0⟩+∣1⟩)(⟨0∣+⟨1∣)−12(∣0⟩−∣1⟩)(⟨0∣−⟨1∣) X=\left[\begin{array}{rr} 0 & 1 \\ 1 & 0 \end{array}\right]=\frac{1}{2}(|0\rangle+|1\rangle)(\langle 0|+\langle 1|)-\frac{1}{2}(|0\rangle-|1\rangle)(\langle 0|-\langle 1|) X=[0110]=21(∣0+∣1⟩)(⟨0∣+1∣)21(∣0∣1⟩)(⟨0∣1∣)

Y=[0−ii0]=12(∣0⟩+i∣1⟩)(⟨0∣−i⟨1∣)−12(∣0⟩−i∣1⟩)(⟨0∣+i⟨1∣) Y=\left[\begin{array}{rr} 0 & -i \\ i & 0 \end{array}\right]=\frac{1}{2}(|0\rangle+i|1\rangle)(\langle 0|-i\langle 1|)-\frac{1}{2}(|0\rangle-i|1\rangle)(\langle 0|+i\langle 1|) Y=[0ii0]=21(∣0+i∣1⟩)(⟨0∣i1∣)21(∣0i∣1⟩)(⟨0∣+i1∣)

2.1.6 伴随和厄米算子

定义1:伴随

假设AAA是希尔伯特空间VVV上的任意一个线性算子。在VVV上存在一个唯一的线性算子A†A^{\dagger}A,满足对所有向量∣v⟩,∣w⟩∈V|v\rangle ,|w\rangle\in Vv,wV都有
(∣v⟩,A∣w⟩)=(A†∣v⟩,∣w⟩)(2.32) (|v\rangle, A|w\rangle)=\left(A^{\dagger}|v\rangle,|w\rangle\right)(2.32) (v,Aw⟩)=(Av,w)(2.32)
这个线性算子称为AAA算子的伴随或厄米共轭。

性质:

  • (AB)†=B†A†(A B)^{\dagger}=B^{\dagger} A^{\dagger}(AB)=BA
  • 如果∣v⟩|v\ranglev是一个向量,定义∣v⟩†≡⟨v∣|v\rangle^{\dagger} \equiv\langle v|vv,可以得出(A∣v⟩)†=⟨v∣A†(A|v\rangle)^{\dagger}=\langle v| A^{\dagger}(Av)=vA
  • 如果∣v⟩|v\ranglev∣w⟩|w\ranglew是两个任意的向量,则(∣w⟩⟨v∣)†=∣v⟩⟨w∣(|w\rangle\langle v|)^{\dagger}=|v\rangle\langle w|(wv)=vw
  • 伴随算子是反线性的,满足(∑iaiAi)†=∑iai∗Ai†\left(\sum_{i} a_{i} A_{i}\right)^{\dagger}=\sum_{i} a_{i}^{*} A_{i}^{\dagger}(iaiAi)=iaiAi
  • (A†)†=A\left(A^{\dagger}\right)^{\dagger}=A(A)=A
定义2:伴随的矩阵表示

在算子AAA的矩阵表示中,厄米共轭运算是将矩阵AAA取共轭转置,A†≡(A∗)TA^{\dagger} \equiv\left(A^{*}\right)^{T}A(A)T,其中∗*是复共轭,TTT是转置操作。

性质:

  • 如果算子AAA的伴随矩阵还是AAA,那么算子AAA为厄米的或自伴算子。
定义3:投影算子

假设WWWddd维向量空间VVV的一个kkk维向量子空间。根据格拉姆-施密特方法可以构造出一组VVV的标准正交基∣1⟩,…,∣d⟩|1\rangle, \ldots,|d\rangle∣1,,d,使得∣1⟩,…,∣k⟩|1\rangle, \ldots,|k\rangle∣1,,kWWW的一组标准正交基。定义
P≡∑i=1k∣i⟩⟨i∣(2.35) P \equiv \sum_{i=1}^{k}|i\rangle\langle i|(2.35) Pi=1kii(2.35)
是在子空间WWW上的投影。

性质:

  • PPP是厄米的,P†=PP^{\dagger}=PP=P
  • PPP的正交补时算子Q≡I−PQ \equiv I-PQIPQQQ∣k+1⟩,…,∣d⟩|k+1\rangle, \ldots,|d\ranglek+1,,d张成的向量空间上的投影。
  • P2=PP^{2}=PP2=P
定义4:谱分解

如果AA†=A†AA A^{\dagger}=A^{\dagger} AAA=AA,那么算子AAA正规的。如果一个算子是厄米的,那么它一定是正规的。谱分解表明如果一个算子是正规的,当且仅当它可对角化。

定义5:酉矩阵

如果一个矩阵UUU满足U†U=IU^{\dagger} U=IUU=I,那么称它是酉的。一个算子是酉的当且仅当它的每一个矩阵表示都是酉的。酉算子满足UU†=IUU^{\dagger}=IUU=IUUU是正规的且可以谱分解。

定义6:正算子(半正定算子)

对任意的向量∣v⟩\left | v \right \ranglev都有(∣v⟩,A∣v⟩)(\left | v \right \rangle ,A\left | v \right \rangle )(v,Av)是一个非负实数。如果对所有的∣v⟩≠0\left | v \right \rangle \ne 0v=0(∣v⟩,A∣v⟩)(\left | v \right \rangle ,A\left | v \right \rangle )(v,Av)都严格大于0,则称AAA为正定的。

2.1.7 张量积

定义1:张量积

VVVWWW分别是m维和n维的希尔伯特向量空间,那么V⊗WV \otimes WVW是一个mn维的向量空间。V⊗WV \otimes WVW里的元素是VVV空间中的元素∣v⟩|v\ranglevWWW空间中的元素∣w⟩|w\ranglew的张量积∣v⟩⊗∣w⟩|v\rangle \otimes|w\ranglevw的线性组合。

  • 如果∣i⟩|i\ranglei∣j⟩|j\ranglej是空间VVVWWW中的标准正交基,那么∣i⟩⊗∣j⟩|i\rangle \otimes|j\rangleij∣v⟩⊗∣w⟩|v\rangle \otimes|w\ranglevw的 一组基
  • ∣v⟩∣w⟩,∣v,w⟩,∣vw⟩|v\rangle|w\rangle,|v, w\rangle,|v w\ranglevw,v,w,vw都可以表示张量积v⟩⊗∣w⟩v\rangle \otimes|w\ranglevw
定义2:张量积的性质
  1. 对于任意的标量zzzVVV中元素∣v⟩|v\ranglevWWW中元素∣w⟩|w\ranglew​,有
    z(∣v⟩⊗∣w⟩)=(z∣v⟩)⊗∣w⟩=∣v⟩⊗(z∣w⟩)(2.42) z(|v\rangle \otimes|w\rangle)=(z|v\rangle) \otimes|w\rangle=|v\rangle \otimes(z|w\rangle)(2.42) z(vw⟩)=(zv⟩)w=v(zw⟩)(2.42)

  2. VVV中的任意向量∣v1⟩\left|v_{1}\right\ranglev1和$\left|v_{2}\right\rangle ,以及,以及,以及W中任意向量中任意向量中任意向量|w\rangle $,有
    (∣v1⟩+∣v2⟩)⊗∣w⟩=∣v1⟩⊗∣w⟩+∣v2⟩⊗∣w⟩(2.43) \left(\left|v_{1}\right\rangle+\left|v_{2}\right\rangle\right) \otimes|w\rangle=\left|v_{1}\right\rangle \otimes|w\rangle+\left|v_{2}\right\rangle \otimes|w\rangle(2.43) (v1+v2)w=v1w+v2w(2.43)

  3. VVV中的任意向量∣v⟩|v\ranglevWWW中任意向量∣w1⟩,∣w2⟩\left|w_{1}\right\rangle , \left|w_{2}\right\ranglew1,w2,有
    ∣v⟩⊗(∣w1⟩+∣w2⟩)=∣v⟩⊗∣w1⟩+∣v⟩⊗∣w2⟩(2.44) |v\rangle \otimes\left(\left|w_{1}\right\rangle+\left|w_{2}\right\rangle\right)=|v\rangle \otimes\left|w_{1}\right\rangle+|v\rangle \otimes\left|w_{2}\right\rangle (2.44) v(w1+w2)=vw1+vw2(2.44)

  4. 假设AAABBB分别是VVVWWW中的线性算子,则V⊗WV \otimes WVW上的线性算子A⊗BA \otimes BAB
    (A⊗B)(∣v⟩⊗∣w⟩)≡A∣v⟩⊗B∣w⟩(2.45) (A \otimes B)(|v\rangle \otimes|w\rangle) \equiv A|v\rangle \otimes B|w\rangle(2.45) (AB)(vw⟩)AvBw(2.45)
    拓展到V⊗WV \otimes WVW上的所有元素,即
    (A⊗B)(∑iai∣vi⟩⊗∣wi⟩)≡∑iaiA∣vi⟩⊗B∣wi⟩(2.46) (A \otimes B)\left(\sum_{i} a_{i}\left|v_{i}\right\rangle \otimes\left|w_{i}\right\rangle\right) \equiv \sum_{i} a_{i} A\left|v_{i}\right\rangle \otimes B\left|w_{i}\right\rangle(2.46) (AB)(iaiviwi)iaiAviBwi(2.46)

  5. A:V→V′A: V \rightarrow V^{\prime}A:VVB:W→W′B: W \rightarrow W^{\prime}B:WW,任意一个从V⊗WV \otimes WVWV′⊗W′V' \otimes W'VW上的线性算子CCC都可以写成映射VVVV′V'V的算子和WWWW′W'W的算子的张量积的线性组合
    C=∑iciAi⊗Bi(2.47) C=\sum_{i} c_{i} A_{i} \otimes B_{i}(2.47) C=iciAiBi(2.47)
    可以得到(∑iciAi⊗Bi)∣v⟩⊗∣w⟩≡∑iciAi∣v⟩⊗Bi∣w⟩\left(\sum_{i} c_{i} A_{i} \otimes B_{i}\right)|v\rangle \otimes|w\rangle \equiv \sum_{i} c_{i} A_{i}|v\rangle \otimes B_{i}|w\rangle(iciAiBi)vwiciAivBiw(2.48)

  6. V⊗WV \otimes WVW空间上的内积定义为
    (∑iai∣vi⟩⊗∣wi⟩,∑jbj∣vj′⟩⊗∣wj′⟩)≡∑ijai∗bj⟨vi∣vj′⟩⟨wi∣wj′⟩(2.49) \left(\sum_{i} a_{i}\left|v_{i}\right\rangle \otimes\left|w_{i}\right\rangle, \sum_{j} b_{j}\left|v_{j}^{\prime}\right\rangle \otimes\left|w_{j}^{\prime}\right\rangle\right) \equiv \sum_{i j} a_{i}^{*} b_{j}\left\langle v_{i} \mid v_{j}^{\prime}\right\rangle\left\langle w_{i} \mid w_{j}^{\prime}\right\rangle(2.49) (iaiviwi,jbj vj wj)ijaibjvivjwiwj(2.49)
    空间V⊗WV \otimes WVW同样满足伴随性、酉性、正规性和厄米性

定义3:张量积的矩阵表示

假设AAA是一个m×nm\times nm×n矩阵,BBBp×qp\times qp×q矩阵,则
A⊗B≡[A11BA12B…A1nBA21BA22B…A2nB⋮⋮⋮⋮Am1BAm2B…AmnB]⏞nq(2.50) A \otimes B \equiv \overbrace{\left[\begin{array}{cccc} A_{11} B & A_{12} B & \ldots & A_{1 n} B \\ A_{21} B & A_{22} B & \ldots & A_{2 n} B \\ \vdots & \vdots & \vdots & \vdots \\ A_{m 1} B & A_{m 2} B & \ldots & A_{m n} B \end{array}\right]}^{n q}(2.50) AB A11BA21BAm1BA12BA22BAm2BA1nBA2nBAmnB nq(2.50)
exp. 向量(1,2)(1,2)(1,2)(2,3)(2,3)(2,3)的张量积是向量
[12]⊗[23]=[1×21×32×22×3]=[2346](2.51) \left[\begin{array}{l} 1 \\ 2 \end{array}\right] \otimes\left[\begin{array}{l} 2 \\ 3 \end{array}\right]=\left[\begin{array}{l} 1 \times 2 \\ 1 \times 3 \\ 2 \times 2 \\ 2 \times 3 \end{array}\right]=\left[\begin{array}{l} 2 \\ 3 \\ 4 \\ 6 \end{array}\right](2.51) [12][23]= 1×21×32×22×3 = 2346 (2.51)
泡利矩阵XXXYYY的张量积是
X⊗Y=[0⋅Y1⋅Y1⋅Y0⋅Y]=[000−i00i00−i00i000](2.52) X \otimes Y=\left[\begin{array}{ll} 0 \cdot Y & 1 \cdot Y \\ 1 \cdot Y & 0 \cdot Y \end{array}\right]=\left[\begin{array}{cccc} 0 & 0 & 0 & -i \\ 0 & 0 & i & 0 \\ 0 & -i & 0 & 0 \\ i & 0 & 0 & 0 \end{array}\right] (2.52) XY=[0Y1Y1Y0Y]= 000i00i00i00i000 (2.52)
∣ψ⟩⊗k|\psi\rangle^{\otimes k}ψk表示∣ψ⟩|\psi\rangleψ与它自身的kkk次张量积。

2.1.8 算子函数

函数可以通过算子和矩阵来定义,给定一个从复数域映射到复数域的函数fff,就可以定义正规矩阵或其子类上的相应矩阵函数。

定义1:如何定义算子函数

A=∑aa∣a⟩⟨a∣A= {\textstyle \sum_{a}}a\left | a \right \rangle \left \langle a\right |A=aaaa是正规算子AAA的一个谱分解。定义f(A)=∑af(a)∣a⟩⟨a∣f(A)= {\textstyle \sum_{a}}f(a)\left | a \right \rangle \left \langle a\right |f(A)=af(a)aa

定义2:矩阵的迹

AAA的迹定义为其对角元素的和:
tr(A)=∑iAii(2.59) \mathrm{tr}(A)=\sum_{i}A_{ii} (2.59) tr(A)=iAii(2.59)
性质:

  • tr(AB)=tr(BA)\mathrm{tr}(AB)=\mathrm{tr}(BA)tr(AB)=tr(BA)
  • tr(A+B)=tr(A)+tr(B)\mathrm{tr}(A+B)=\mathrm{tr}(A)+\mathrm{tr}(B)tr(A+B)=tr(A)+tr(B)
  • tr(zA)=ztr(A)\mathrm{tr}(zA)=z\mathrm{tr}(A)tr(zA)=ztr(A)
  • 矩阵的迹在酉相似变换A→UAU†A\to UAU^{\dagger}AUAU下是不变的,tr(UAU†)=tr(U†UA)=tr(A)\mathrm{tr}(UAU^{\dagger})=\mathrm{tr}(U^{\dagger}UA)=\mathrm{tr}(A)tr(UAU)=tr(UUA)=tr(A)
    • AAA的迹为AAA的任意矩阵表示的迹
    • 迹在酉相似变换下的不变性确保了算子的迹是定义良好的
常用

∣ψ⟩\left | \psi \right \rangleψ是单位向量,AAA是一个任意的算子。利用格拉姆-施密特方法将∣ψ⟩\left | \psi \right \rangleψ扩展到一组标准正交基∣i⟩\left | i \right \ranglei上,其中∣ψ⟩\left | \psi \right \rangleψ是它第一个元素,则有
tr(A∣ψ⟩⟨ψ∣)=∑i⟨i∣A∣ψ⟩⟨ψ∣i⟩(2.60)=⟨ψ∣A∣ψ⟩(2.61) \begin{aligned} \mathrm{tr}(A\left | \psi \right \rangle \left \langle \psi \right | ) & =\sum_{i} \left \langle i \right |A\left | \psi \right \rangle \left \langle \psi | i \right \rangle (2.60)\\ & =\left \langle \psi \right | A\left | \psi \right \rangle (2.61) \end{aligned} tr(Aψψ)=iiAψψi(2.60)=ψAψ(2.61)

2.1.9 对易式和反对易式

定义1:对易commute和反对易

两个算子AAABBB的对易式定义为
[A,B]≡AB−BA(2.66) [A,B]\equiv AB-BA(2.66) [A,B]ABBA(2.66)
如果[A,B]=0[A,B]=0[A,B]=0,也就是AB=BAAB=BAAB=BA,那么AAABBB是对易的。

两个算子AAABBB的反对易式定义为
{A,B}≡AB+BA \{A,B\}\equiv AB+BA {A,B}AB+BA
如果{A,B}=0\{A,B\}=0{A,B}=0,那么AAABBB是反对易的。

定理2.2 可同时对角化定理

假设AAABBB是厄米算子。那么[A,B]=0[A,B]=0[A,B]=0成立当且仅当存在一组标准正交基使得AAABBB可同时对角化,也就是AAABBB是可同时对角化的。

exp. 判断泡利矩阵XXXYYY的关系
[X,Y]=[0110][0−ii0]−[0−ii0][0110]=2i[100−1]=2iZ \begin{aligned} {[X, Y] } & =\left[\begin{array}{ll} 0 & 1 \\ 1 & 0 \end{array}\right]\left[\begin{array}{rr} 0 & -i \\ i & 0 \end{array}\right]-\left[\begin{array}{rr} 0 & -i \\ i & 0 \end{array}\right]\left[\begin{array}{ll} 0 & 1 \\ 1 & 0 \end{array}\right] \\ & =2 i\left[\begin{array}{rr} 1 & 0 \\ 0 & -1 \end{array}\right] \\ & =2 i Z \end{aligned} [X,Y]=[0110][0ii0][0ii0][0110]=2i[1001]=2iZ
所以XXXYYY不是对易的。

2.1.10 极式分解和奇异值分解

极式分解和奇异值分解是将线性算子分解得更简单有用得方法,可将一般的线性算子分解为酉算子和正算子的乘积

定理2.3 极式分解

AAA是向量空间VVV上的一个线性算子。那么存在酉算子UUU和正算子J,KJ,KJ,K使得
A=UJ=KU(2.79) A=UJ=KU(2.79) A=UJ=KU(2.79)
其中J≡A†A,K≡AA†J\equiv \sqrt{A^{\dagger}A} ,K\equiv \sqrt{AA^{\dagger}}JAA ,KAA ,并且JJJKKK是唯一满足这些等式的正算子。如果AAA是可逆的,那么UUU是唯一的。

  • A=UJA=UJA=UJAAA的左极式分解,A=KUA=KUA=KUAAA的右极式分解
推论2.4 奇异值分解

奇异值分解将极式分解和谱分解定理结合了起来。设AAA是一个方阵,那么存在酉矩阵UUUVVV,以及非负对角阵DDD,使得
A=UDV(2.80) A=UDV(2.80) A=UDV(2.80)
DDD的对角元素称为AAA​的奇异值。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐