机器学习之十六：HMM（隐马尔可夫模型）

1、什么是HMM：    先来看一个例子：假设有4个盒子，每个盒子里面都装有红白两种颜色的球，盒子里面的红白球有下表给出：盒子1234红球数 5368白球数 5742    按照下面的方法抽球，产生一个球的颜色的随机序列：开始，从4个盒子里以等概率随机选取

蓬莱道人

889人浏览 · 2018-05-06 18:05:33

蓬莱道人 · 2018-05-06 18:05:33 发布

1、什么是HMM：
先来看一个例子：假设有4个盒子，每个盒子里面都装有红白两种颜色的球，盒子里面的红白球有下表给出：

盒子	1	2	3	4
红球数	5	3	6	8
白球数	5	7	4	2

按照下面的方法抽球，产生一个球的颜色的随机序列：开始，从4个盒子里以等概率随机选取一个盒子，从这个盒子里随机抽出一个球，记录其颜色，放回；然后，从当前盒子随机转移到下一个盒子，规则是：如果当前盒子是盒子1，那么下一个盒子一定是盒子2，如果当前盒子是盒子2或者3，那么分别以概率0.4和0.6转移到左边或者右边盒子，如果当前盒子是4，那么各以0.5概率停留在盒子4或者转移到盒子3；确定转移盒子之后，再从这个盒子随机抽出一个球，记录其颜色，放回；如此下去，重复进行5次，得到一个球颜色的观测序列：

O = {红 ， 红 ， 白 ， 白 ， 红}

Q = {盒 子 1 ， 盒 子 2 ， 盒 子 3 ， 盒 子 4} ， N = 4

V = {红 ， 白} ， M = 2

π = (0.25, 0.25, 0.25, 0.25) T

A[i][j]A[i][j]<script type="math/tex" id="MathJax-Element-617">A[i][j]</script>表示当前是第

ii<script type="math/tex" id="MathJax-Element-618">i</script>个盒子，下一个盒子是

j

A = ⎡ ⎣ ⎢ ⎢ ⎢ 0 0.4 00 10 0.4 0 0 0.6 0 0.5 00 0.6 0.5 ⎤ ⎦ ⎥ ⎥ ⎥

B[i][j]B[i][j]<script type="math/tex" id="MathJax-Element-621">B[i][j]</script>表示第

ii<script type="math/tex" id="MathJax-Element-622">i</script>个盒子下选择第

j

B = ⎡ ⎣ ⎢ ⎢ ⎢ 0.5 0.3 0.6 0.8 0.5 0.7 0.4 0.2 ⎤ ⎦ ⎥ ⎥ ⎥

HMMHMM<script type="math/tex" id="MathJax-Element-625">HMM</script>的定义：
隐马尔科夫模型是关于时序的概率模型，描述一个隐藏的马尔科夫链随机生成不可观测的状态随机序列，再由各个状态生成一个观测而产生观测随机序列的过程。隐马尔科夫模型由初始概率分布、状态转移概率分布以及观测概率分布确定，隐马尔科夫模型的形式定义如下：
设

QQ<script type="math/tex" id="MathJax-Element-626">Q</script>是所有可能的状态的集合，

V

Q = {q 1, q 2, . . ., q N} V = {v 1, v 2, . . ., v M}

NN<script type="math/tex" id="MathJax-Element-629">N</script>是可能的状态数，

M

II<script type="math/tex" id="MathJax-Element-631">I</script>是长度为

T

OO<script type="math/tex" id="MathJax-Element-633">O</script>是对应的观测序列：

I = {i_{1}, i_{2}, . . ., i_{T}} O = {o_{1}, o_{2}, . . ., o_{T}}

AA<script type="math/tex" id="MathJax-Element-635">A</script>是状态转移概率矩阵：

A = [a_{i j}]_{N \times N}

a i j = P (i t + 1 = q j | i t = q i), i = 1, 2, 3, . ., N, j = 1, 2, . . ., N

tt<script type="math/tex" id="MathJax-Element-638">t</script>处于

q_{i}

t+1t+1<script type="math/tex" id="MathJax-Element-640">t+1</script>转移到

qjqj<script type="math/tex" id="MathJax-Element-641">q_j</script>的概率.

BB<script type="math/tex" id="MathJax-Element-642">B</script>是观测概率矩阵：

B = [b_{j} (k)]_{N \times M}

b j (k) = P (o t = v k | i t = q j), k = 1, 2, . . ., M, j = 1, 2, . . ., N

tt<script type="math/tex" id="MathJax-Element-645">t</script>处于状态

q_{j}

vkvk<script type="math/tex" id="MathJax-Element-647">v_k</script>的概率.

ππ<script type="math/tex" id="MathJax-Element-648">\pi</script>是初始状态概率向量：

π = (π i)

π i = P (i 1 = q i), i = 1, 2, . . ., N

t=1t=1<script type="math/tex" id="MathJax-Element-651">t=1</script>处于状态

qiqi<script type="math/tex" id="MathJax-Element-652">q_i</script>的概率。
隐马尔科夫模型由初始概率向量

ππ<script type="math/tex" id="MathJax-Element-653">\pi</script>、状态转移概率矩阵

AA<script type="math/tex" id="MathJax-Element-654">A</script>和观测概率矩阵

B

ππ<script type="math/tex" id="MathJax-Element-656">\pi</script>和

AA<script type="math/tex" id="MathJax-Element-657">A</script>决定状态序列，

B

λλ<script type="math/tex" id="MathJax-Element-659">\lambda</script>可以用三元符号表示：

λ = (A, B, π)

A,B,λA,B,λ<script type="math/tex" id="MathJax-Element-661">A,B,\lambda</script>称为隐马尔科夫模型的三要素。
隐马尔科夫模型可以用于标注，这时状态对应标记。标注问题是给定观测的序列预测其对应的标记序列，可以假设标注问题的数据是由隐马尔科夫模型生成的。
2、隐马尔科夫模型的三个基本问题：
（1）概率计算问题：给定模型

λ=(A,B,π)λ=(A,B,π)<script type="math/tex" id="MathJax-Element-662">\lambda=(A,B,\pi)</script>和观测序列

O={o1,o2,...,oT}O={o1,o2,...,oT}<script type="math/tex" id="MathJax-Element-663">O=\{o_1,o_2,...,o_T\}</script>，计算在模型

λλ<script type="math/tex" id="MathJax-Element-664">\lambda</script>下观测序列

OO<script type="math/tex" id="MathJax-Element-665">O</script>出现的概率

P (O | λ)

O={o1,o2,...,oT}O={o1,o2,...,oT}<script type="math/tex" id="MathJax-Element-667">O=\{o_1,o_2,...,o_T\}</script>，估计模型

λ=(A,B,π)λ=(A,B,π)<script type="math/tex" id="MathJax-Element-668">\lambda=(A,B,\pi)</script>的参数，使得在该模型下观测序列的概率

P(O|λ)P(O|λ)<script type="math/tex" id="MathJax-Element-669">P(O|\lambda)</script>最大。即用最大似然估计的方法估计参宿。
（3）预测问题，也称为解码问题。已知模型

λ=(A,B,π)λ=(A,B,π)<script type="math/tex" id="MathJax-Element-670">\lambda=(A,B,\pi)</script>和观测序列

O={o1,o2,...,oT}O={o1,o2,...,oT}<script type="math/tex" id="MathJax-Element-671">O=\{o_1,o_2,...,o_T\}</script>，求对给定观测序列条件概率

P(I|O)P(I|O)<script type="math/tex" id="MathJax-Element-672">P(I|O)</script>最大的状态序列

I=(i1,i2,...,iT)I=(i1,i2,...,iT)<script type="math/tex" id="MathJax-Element-673">I=(i_1,i_2,...,i_T)</script>，即给定观测序列，求最有可能对应的状态序列。
3、概率计算问题：待续。。
4、学习问题：待续。。
5、预测问题：待续。。

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

通过测试-时强化学习实现VLA的动态自适应

DAMO开发者矩阵

3D视觉码垛闭环系统全解析

3D视觉系统通过深度相机（如ToF、双目或结构光）获取点云数据，结合RGB信息分割堆叠物体。点云预处理包含降噪、滤波与平面分割，目标识别通常采用深度学习模型或传统几何匹配。机器视觉3D码垛系统通过视觉感知、路径规划、运动控制与反馈校正实现闭环操作。核心流程包括目标识别、位姿估计、避障规划、抓取放置与实时校准。以下分模块拆解技术细节。通过PCA或ICP算法计算目标物体的6D位姿（3D位置+3D旋转）