一、概念

        马尔可夫链(Markov Chain, MC)是具有 “无后效性” 的随机过程,核心是 “未来状态的概率仅依赖于当前状态,与更早期的状态无关”。它是时间序列分析、强化学习、蒙特卡洛方法(MCMC)等领域的基础数学模型,广泛用于描述状态随时间随机转移的系统(如天气变化、股票波动、用户行为序列等)。

二、原理

        马尔可夫链的本质是马尔可夫性(Markov Property),其数学定义为:对于任意时刻 t,系统的下一个状态X_{t+1}的条件概率,仅由当前状态X_{t}决定,与历史状态无关。即:

P(X_{t+1} | X_{t})=P(X_{t+1} | X_{1},X_{2},...,X_{t})

三、构成要素

        一个完整的马尔可夫链由3个核心要素构成,缺一不可。

1、状态空间S

        系统所有可能的 “状态” 集合,可分为离散状态空间(有限或无限)和连续状态空间(通常称为 “马尔可夫过程”)。

  • 离散有限集合:如天气,S={晴,雨,阴};
  • 离散无限集合:如随机游走,S={...,-2,-1,0,1,2,...},状态为整数位置;
  • 连续集合:如温度,S={-50,50},状态为温度值,连续,此时为马尔可夫过程。

2、转移概率矩阵P

        描述 “从一个状态转移到另一个状态的概率”,是马尔可夫链的 “动态核心”。对于离散状态空间S = \left \{ s_{1}, s_{2}, ..., s_{n} \right \},转移概率矩阵 P 是一个 n × n 的矩阵,其中元素P_{ij}表示“当前状态为s_{i}时,下一个状态为s_{j}的概率”,即:

P_{ij} = P(X_{t+1}=s_{j} | X_{t}=s_{i})

        转移概率矩阵具有如下几个关键性质:

  • 每行元素之和为1(概率的归一性):\sum_{j=1}^{n}P_{ij} = 1,从任意状态出发,下一个状态必属于S;
  • 元素非负:P_{ij}大于等于0,因为概率不能为负数。

3、初始状态分布\pi

        系统在初始时刻 t=0 的状态概率分布,即\pi_{i} = P(X_{0}=s_{i}),满足\sum_{i=1}^{n} \pi_{i} = 1,且\pi_{i} \geq 0。例如,当天气的初始时刻(t=0)为晴的概率是0.5,雨的概率是0.3,阴的概率是0.2,则有:

\pi = \left [ 0.5, 0.3, 0.2 \right ]

四、关键性质(离散有限状态)

        马尔可夫链的长期行为由其结构决定,核心性质包括:

1、齐次性(时间齐次性)

        转移概率不随时间变化,即从状态s_{i}s_{j}的概率,在任意时刻t都相同,数学表达式为:

P(X_{t+1}=s_{j} | X_{t}=s_{i}) = P(X_{k+1}=s_{j} | X_{k}=s_{i})

        大多数场景下默认讨论 “齐次马尔可夫链”(如天气转移概率不随季节变化),非齐次链(转移概率随时间变)需额外标注。

2、不可约性

        对于任意两个状态s_{i},s_{j} \in S,存在某个时刻k \geq 1,使得从s_{i}出发经过k步转移到s_{j}的概率大于0。即系统可以从任意一个状态到达其他任意状态,不存在孤立的子状态集合。

        为了直观理解,我们可以举一个反例,若状态空间分为{晴,阴}和{雨},且 “晴 / 阴无法转移到雨,雨也无法转移到晴 / 阴”,则该链是 “可约的”。

3、遍历性

        若马尔可夫链不可约且 “非周期”(状态的返回周期为 1,即不会陷入 “晴→阴→晴→阴” 的固定周期循环),则存在平稳分布\pi^{*},满足\pi^{*} = \pi^{*} P。且无论初始分布\pi如何,当转移步数k \rightarrow \infty时,k步转移概率矩阵P^{k}的每行都会收敛到\pi^{*}

        简单来说,就是系统长期运行后,状态分布会稳定在一个固定的平稳分布上,与初始状态无关。例如天气链长期运行后,晴、雨、阴的概率会稳定在某个值,不再变化。

五、示例

        这里,我们用矩阵表示马尔可夫链状态转移,并计算平稳分布。设有三个状态S={s1,s2,s3},则其状态转移概率矩阵P定义为:

P = \begin{bmatrix} P(s_{1} | s_{1}) & P(s_{2} | s_{1}) & P(s_{3} | s_{1})\\ P(s_{1} | s_{2}) & P(s_{2} | s_{2}) & P(s_{3} | s_{2})\\ P(s_{1} | s_{3}) & P(s_{2} | s_{3}) & P(s_{3} | s_{3}) \end{bmatrix}

        其中,P(s_{j} | s_{i})表示从状态s_{i}转移到s_{j}的概率,且每行元素之和为1,满足概率归一性。这里,我们设定每个状态的具体数值,有:

P = \begin{bmatrix} 0.7 & 0.1 & 0.2\\ 0.2 & 0.6 & 0.2\\ 0.3 & 0.2 & 0.5 \end{bmatrix}

        下面我们计算平稳分布,根据定义,平稳分布\pi = \left [ \pi_{1},\pi_{2},\pi_{3} \right ]需要满足以下条件:

  • 转移后分布不变:\pi P = \pi
  • 概率归一性:\sum_{i=1}^{3} \pi_{i} =1
  • 非负性:\pi_{i} \geq 0

        我们将\pi P = \pi展开为方程组有:

\left\{\begin{matrix} \pi_{1} = 0.7\pi_{1} + 0.2\pi_{2} + 0.3\pi_{3} \\ \pi_{2} = 0.1\pi_{1} + 0.6\pi_{2} + 0.2\pi_{3} \\ \pi_{3} = 0.2\pi_{1} + 0.2\pi_{2} + 0.5\pi_{3} \\ \pi_{1} + \pi_{2} + \pi_{3} = 1 \end{matrix}\right.

        解方程得\pi_{1} = \frac{16}{35} \approx 0.4571, \pi_{2} = \frac{9}{35} \approx 0.2571, \pi_{3} = \frac{2}{7} \approx 0.2857,验证得\pi P \approx \left [ 0.4571, 0.2571, 0.2857 \right ],满足平稳分布条件。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐