【深度学习】【入门】DataLoader的使用

PyTorch中的DataLoader是用于高效加载和批处理数据的工具类。文章介绍了DataLoader的常用参数：dataset（必选数据集）、batch_size（批量大小）、shuffle（是否打乱数据）、num_workers（子进程数）和drop_last（是否丢弃不完整批次）。通过CIFAR10数据集示例演示了DataLoader的使用，重点解决了TensorBoard中add_ima

2401_86886401

758人浏览 · 2025-07-01 14:59:35

2401_86886401 · 2025-07-01 14:59:35 发布

1.DataLoader简介

DataLoader 是 PyTorch 中的一个工具类，用于高效加载和批量处理数据集。它支持自动批处理、数据 shuffling 和多进程数据加载，简化了数据预处理和模型训练流程。

2.DataLoader的参数

以上是pytorch官网中关于DataLoader的参数，下面我会讲解常用的参数的类型及作用

（1）dataset

必填，为要加载数据的数据集

（2）batch_size

可选，每批加载样本数量，默认1

（3）shuffle

可选，布尔值，设为True则每个周期开始时打乱数据，默认False

（4）num_workers

可选，数据加载子进程数量，0表示主进程加载，大于0开启多进程并行加载，能提高大规模数据加载速度

（5）drop_last

可选，布尔值，数据集样本不能被batch_size整除时，设True丢弃最后不完整批次，默认False

3.DataLoader的使用

第一个代码：

import torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

test_data = torchvision.datasets.CIFAR10("./dataset", train=False, transform=torchvision.transforms.ToTensor(), download=False)

test_loader = DataLoader(dataset=test_data, batch_size=4, shuffle=True, num_workers=0, drop_last=False)

writer =SummaryWriter("dataloader")
step = 0
for data in test_loader:
    imgs,targets = data
    writer.add_image("test_data", imgs, step)
    step = step + 1

writer.close()

第一个代码遇到的问题：

表明张量的输入情况和期望的输入格式不匹配

第一个代码问题的解决方法：

其实此代码的问题是一个不起眼的小地方，add_image和add_images的却别

add_image:

适用于想展示单个图像的情况，比如可视化数据集里的某一张样本图像，或者展示模型在某一次预测输出的单张图像结果

add_images:

常用于展示一批图像，比如可视化训练或测试集中的多个样本，或者在图像生成任务中展示生成的一批图像结果，方便直观对比多张图像

第二个代码：

import torchvision
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

test_data = torchvision.datasets.CIFAR10("./dataset", train=False, transform=torchvision.transforms.ToTensor(), download=False)

test_loader = DataLoader(dataset=test_data, batch_size=4, shuffle=True, num_workers=0, drop_last=False)

writer =SummaryWriter("../dataloader")
step = 0
for data in test_loader:
    imgs,targets = data
    writer.add_images("test_data", imgs, step)
    step = step + 1

writer.close()

结果：

4.修改参数的结果

（1）修改batch_size

变为：

遇到的问题：

在改变batch_size后加载的图像还是4张为一组

解决方法：

注：博主了解了主要的问题，要将tag修改就可以在一个目录下增加图像

（2）修改drop_last

变为：

（3）修改shuffle

变为：

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

微信社群机器人搭建教程/开发

DAMO开发者矩阵

一体双生: 计算机图形学与计算机视觉本就“同宗同源”

当我们站在现在回望，计算机图形学和计算机视觉的分野，更多是受限于早期算力和算法的无奈之举。算力不足时，CG 只能用光栅化骗过眼睛，CV 只能用边缘检测提取特征。算力充裕时，CG 开始用光线追踪模拟物理，CV 开始用 Transformer 理解全局。如今，随着3D AIGCXR（空间计算）和具身智能（Embodied AI）的兴起，两者正在回归它们的共同本质——对视觉信息的全链路处理。未来的工程师

DAMO开发者矩阵

改进型深度Q-网格DQN和蒙特卡洛树搜索MCTS以及模型预测控制MPC强化学习的机器人室内导航仿真

本文摘要：本研究实现了一个基于TurtleBot3机器人的自主导航系统，包含以下核心技术：1) 通过Gazebo仿真环境构建SLAM地图；2) 采用改进的蒙特卡洛树搜索(MCTS)算法进行路径规划，结合距离启发函数提升搜索效率；3) 设计分层MPC-PID控制器实现路径跟踪；4) 开发一键启动脚本集成整个系统。创新点包括：基于轮廓分析的地图优化、DQN引导的MCTS搜索、安全势场规划以及分层运动