深度学习-基于RNN的语言模型

输入一个词，RNN输出截止到目前为止，下一个最可能的词我昨天上学迟到了其中，s表示序列的开始，e表示序列的结束向量化：one hot 高维稀疏概率语言模型语言模型要求的输出是下一个最可能的词，我们可以让RNN计算词典中每个词是下一个词的概率，这样，概率最大的词就是下一个最可能的词。因此，神经网络的输出向量也是一个N维向量，向量中的每个元素对应着词典中相应的词是下一个词的概率。Softmax

zero requiem

617人浏览 · 2020-12-31 20:13:03

zero requiem · 2020-12-31 20:13:03 发布

输入一个词，RNN输出截止到目前为止，下一个最可能的词

我 昨天 上学 迟到 了

在这里插入图片描述其中，s表示序列的开始，e表示序列的结束

向量化：

one hot 高维稀疏
概率语言模型

语言模型要求的输出是下一个最可能的词，我们可以让RNN计算词典中每个词是下一个词的概率，这样，概率最大的词就是下一个最可能的词。因此，神经网络的输出向量也是一个N维向量，向量中的每个元素对应着词典中相应的词是下一个词的概率。

Softmax层
Softmax函数
语言模型是对下一个词出现的概率进行建模
让神经网络输出概率：用softmax层作为神经网络的输出层
在这里插入图片描述

输出向量y = [y1,y2,y3,y4]

每一项为取值为0-1之间的正数
所有项的总和是1

语言模型的训练
获得输入-标签对：

输入x	标签 y
s	我
我	昨天
昨天	上学
上学	迟到
迟到	了
了	e

输入x向量化：one hot 表示字典
标签y向量化：one hot 下一个词是标签y的概率

交叉熵误差函数——模型优化

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

机器人日志十年演进

摘要（149字）： 2015-2025年，机器人日志系统经历了从零散文本到核心数据资产的本质跨越。萌芽期（2015-2017）仅有单机非结构化故障记录；起步期（2018-2020）ROS框架推动标准化集中存储；成熟期（2021-2023）云边端架构实现PB级分布式管理与AI分析；爆发期（2024-2025）将形成具身智能原生的语义化体系。十年演进遵循"标准化-结构化-分布式-智能化-资产

DAMO开发者矩阵

机器人协议十年演进

机器人通信协议十年演进（2015-2025）摘要 2015-2025年，机器人通信协议经历了从封闭单机到开放互联的质变。早期（2015-2017）由厂商私有总线垄断，仅支持单机通信；2018-2020年ROS2/DDS成为分布式标准，工业以太网替代传统总线；2021-2023年国产协议成熟，形成云边端三级架构，实现万台级集群通信；2024-2025年迈向具身智能原生的多模态协议，中国主导国际标准。

DAMO开发者矩阵

移动机器人十年演进

中国移动机器人产业在2015-2025年实现了跨越式发展，从技术跟随到全球引领，完成了四大里程碑式演进：萌芽期（2015-2017）以轨道依赖的AGV为主；起步期（2018-2020）SLAM导航技术突破，AMR崛起；成熟期（2021-2023）多模态融合导航成熟，实现万台级集群应用；爆发期（2024-2025）具身智能原生平台成型，大模型重构技术底层。十年间，产品从单一工业工具发展为全场景通用智