【YOLO数据集】车辆行人检测

MU_kaka

1195人浏览 · 2025-12-24 23:29:56

MU_kaka · 2025-12-24 23:29:56 发布

📥 1、背景

随着城市化进程的加速和智能交通系统的快速发展，车辆与行人目标检测已成为计算机视觉和自动驾驶领域的核心研究方向之一。该技术通过分析摄像头或传感器捕获的图像或视频流，实时识别与定位道路环境中的车辆和行人，为辅助驾驶、碰撞预警、智能监控和自主导航等应用提供关键感知支撑。然而，实际道路场景的复杂性——如光照变化、目标尺度差异、遮挡、密集交通流以及恶劣天气条件——对检测算法的准确性、鲁棒性和实时性提出了严峻挑战。传统检测方法多依赖于手工特征与分类器组合，其泛化能力有限；近年来，随着深度学习的突破，尤其是基于卷积神经网络（CNN）的目标检测模型（如Faster R-CNN、YOLO、SSD等）显著提升了检测性能。

📌 2、数据集概览

项目	内容
数据集名称	车辆行人检测数据集
任务类型	目标检测（Object Detection）
类别	Person、Car
标注格式	YOLO TXT 格式（`<类别> <中心x> <中心y> <宽度> <高度>`，坐标和尺寸均为相对于图像宽高的归一化值（0-1））
图片总数	5607
标注总数	78507

🗂 3、数据详情

类别ID	类别名称	图片数量	标注数量
0	Person	3191	19784
1	Car	4930	58723
总计	-	5607	78507

✨ 4、效果演示

🧠 5、模型训练

1、安装miniconda
地址： https://repo.anaconda.com/miniconda/Miniconda3-latest-Windows-x86_64.exe
环境变量（根据实际的安装目录配置）：

C:\ProgramData\miniconda3 
C:\ProgramData\miniconda3\Scripts 
C:\ProgramData\miniconda3\Library\bin

2、创建虚拟环境

conda create -n yolo python==3.8
# 查看现有环境
conda env list
# 激活环境 
conda activate yolo
# 激活失败 （执行该命令后重新进入cmd）
conda init cmd.exe

3、源码下载
https://github.com/ultralytics/ultralytics
（注意：不同版本的yolo在不同tag）

4、训练脚本

import warnings  
warnings.filterwarnings('ignore')  
from ultralytics import YOLO  
  
if __name__ == '__main__':  
    model = YOLO('ultralytics/cfg/models/v8/yolov8n.pt')  # 指定YOLO模型对象，并加载指定配置文件中的模型配置  
    # model.load('yolov8s.pt')      #加载预训练的权重文件'yolov8s.pt'，加速训练并提升模型性能  
    model.train(data='ultralytics/cfg/datasets/data36.yaml',  # 指定训练数据集的配置文件路径，这个.yaml文件包含了数据集的路径和类别信息  
                cache=False,  # 是否缓存数据集以加快后续训练速度，False表示不缓存  
                imgsz=640,  # 指定训练时使用的图像尺寸，640表示将输入图像调整为640x640像素  
                epochs=100,  # 设置训练的总轮数为200轮  
                batch=8,  # 设置每个训练批次的大小为16，即每次更新模型时使用16张图片  
                close_mosaic=0,  # 设置在训练结束前多少轮关闭 Mosaic 数据增强，10 表示在训练的最后 10 轮中关闭 Mosaic                workers=16,  # 设置用于数据加载的线程数为8，更多线程可以加快数据加载速度  
                patience=300,  # 在训练时，如果经过50轮性能没有提升，则停止训练（早停机制）  
                device='0',  # 指定使用的设备，'0'表示使用第一块GPU进行训练  
                optimizer='SGD',  # 设置优化器为SGD（随机梯度下降），用于模型参数更新  
                )

5、配置文件 data.yaml

path: D:/data/yoloTrain/人车数据集
train: images/train
val: images/val
# number of classes
nc: 2
# class names
names: ["Person", "Car"]

🛠 6、配套服务

我们提供一站式视觉解决方案，包括：

模型训练与调优指导
部署环境远程配置
定制标注与数据增强
毕业设计/课题辅导
企业项目合作开发

❓ 7、常见问题

Q：标注格式如何转换？
A：提供Python转换脚本，支持YOLO→VOC/COCO，开箱即用：点击下载转换脚本

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

TVA与具身智能：感知-行动闭环的技术范式革命（5）

DAMO开发者矩阵

AI 越强，越不该学编程——未来十年真正值得投入的 7 种能力

大家好，之前我讲了很多工作上的技术知识，但现在我发现这些东西ai都可以很轻易的给你们答案，所以，今天我想聊一些关于未来发展方向的话题。前几天，一个朋友给我发消息说："我真的不知道该学什么了。他刚花了三个月啃完一本深度学习教材，结果 GPT-5 发布那天，他发现自己刚学完的内容，AI 三秒钟就能搞定。他说那种感觉就像——你好不容易爬到半山腰，发现山顶上已经站满了机器人，它们正朝你挥手。这种迷茫不只他

DAMO开发者矩阵

2026人形机器人公司推荐：国内外主要企业技术竞争力评估与推荐

综合四家企业的技术架构、硬件实力、量产能力及工业场景落地成果来看，拓斯达凭借全栈自研的核心技术体系、成熟的工业场景商业化闭环、规模化量产出货能力，是当前具身智能工业落地赛道中综合竞争力突出、落地价值明确的标杆企业。我们不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实，不对您构成任何投资建议，据此操作，风险自担