刘二大人PyTorch深度学习实践第12讲循环神经网络

Allyn911

351人浏览 · 2024-10-18 15:07:31

Allyn911 · 2024-10-18 15:07:31 发布

RNN输入输出参数

如图所示，input输入维度，hidden隐层维度，output输出维度

注：seqSize=seqLen，即序列长度

当batch_first=True时，input维度顺序改变，如图所示

输出为out和hidden，out为所有隐层数据，即h1-hn；hidden为最后一层隐层数据，即hn

nn.Embedding

将高维、稀疏的独热编码映射到低维、稠密的空间里（即降维）

深入理解PyTorch中的nn.Embedding的使用 / 张生荣

实质是一张查找表，映射关系如图所示：

输入参数如图所示：

embedding_dim大小的设置原则：

【PyTorch单点知识】torch.nn.Embedding模块介绍：理解词向量与实现-CSDN博客

交叉熵损失的参数维度要求

代码

# 循环神经网络 训练模型：‘hello’→‘ohlol’
import torch

input_size = 4  # 输入大小
hidden_size = 8  # 隐藏层大小
batch_size = 1
num_layers = 2  # RNN层数
seq_len = 5  # 序列长度 x1,x2,x3,x4,x5
embedding_size = 10  # embedding大小
num_class = 4  # 最终输出的类别数

idx2char = ['e', 'h', 'l', 'o']
x_data = [[1, 0, 2, 2, 3]]  # size:[1,5,4] (batch_size,seq_len,input_size)
y_data = [3, 1, 2, 3, 2]  # size:[5]

# nn.Embedding要求输入是LongTensor型
inputs = torch.LongTensor(x_data)
labels = torch.LongTensor(y_data)


class model(torch.nn.Module):
    def __init__(self):
        super(model, self).__init__()
        self.emb = torch.nn.Embedding(input_size, embedding_size)
        self.rnn = torch.nn.RNN(input_size=embedding_size, hidden_size=hidden_size, num_layers=num_layers,
                                batch_first=True)
        # batch_first=True时，input维度为(batch_size,seq_len,input_size)，否则为(seq_len,batch_size,input_size)
        self.fc = torch.nn.Linear(hidden_size, num_class)

    def forward(self, x):
        hidden = torch.zeros(num_layers, x.size(0), hidden_size)
        x = self.emb(x)
        x, _ = self.rnn(x, hidden)
        x = self.fc(x)

        # x由[1,5,4]->[5,4],为了符合之后的CrossEntropyLoss的参数维度要求
        return x.view(-1, num_class)


net = model()

criterion = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(net.parameters(), lr=0.05)

for epoch in range(15):
    outputs = net(inputs)
    loss = criterion(outputs, labels)
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    _, idx = outputs.max(dim=1)  # 选择每一列（dim=0）/行（dim=1）的最大值，输出为（值，索引）
    idx = idx.data.numpy()
    print('Predicted:', ''.join([idx2char[x] for x in idx]), end='')
    print(',Epoch [%d/15] loss = %.3f' % (epoch + 1, loss.item()))

结果

作业：LSTM、GRU

详解pytorch中循环神经网络（RNN、LSTM、GRU）的维度_pytorch gru-CSDN博客

PyTorch序列预测实战：RNN、LSTM、GRU模型构建-CSDN博客

LSTM

李宏毅手撕LSTM_哔哩哔哩_bilibili

人人都能看懂的LSTM - 知乎

GRU

人人都能看懂的GRU - 知乎

代码参考：pytorch深度学习实践（刘二大人）课堂代码&作业——循环神经网络基础篇_pytorch深度学习实践作业-CSDN博客

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

14905黄大年茶思屋榜文第149期第5题面向云手机复杂任务的高效可靠 GUI VLA 模型技术

DAMO开发者矩阵

工业机器人离线仿真全链路研究：ROBOGUIDE 课程体系深度剖析、实操痛点与数字化创新方案

本文系统剖析了七阶段ROBOGUIDE工业机器人离线编程课程体系。该课程采用分层递进设计，从软件基础操作到复杂焊接工艺，完整复刻企业仿真工程师工作流程。核心特色包括：虚实融合的实操导向教学，覆盖搬运、分拣、轨迹加工等主流工业场景；独创"虚拟电机法"与"模型替代法"双抓取仿真技术对比；重点突破变位机协同焊接等高阶应用。课程严格遵循"工作站搭建-编程-

DAMO开发者矩阵

图像识别化技术目标检测模型训练数据标注策略

图像识别技术中的目标检测模型近年来在自动驾驶、安防监控、医疗影像等领域展现出巨大潜力，而模型的性能高度依赖于训练数据的标注质量。对于遮挡、重叠目标，应采用分层标注策略，明确标注可见部分。标注策略需结合具体需求，灵活调整标注粒度和标准，确保模型在实际场景中发挥最佳效果。通过分析模型在测试集上的表现，发现漏检或误检案例，针对性补充标注数据。未来，随着自动化标注技术和多模态融合的发展，数据标注将迈向更高