📥 1、背景

随着城市化进程的加速和智能交通系统的快速发展,车辆与行人目标检测已成为计算机视觉和自动驾驶领域的核心研究方向之一。该技术通过分析摄像头或传感器捕获的图像或视频流,实时识别与定位道路环境中的车辆和行人,为辅助驾驶、碰撞预警、智能监控和自主导航等应用提供关键感知支撑。然而,实际道路场景的复杂性——如光照变化、目标尺度差异、遮挡、密集交通流以及恶劣天气条件——对检测算法的准确性、鲁棒性和实时性提出了严峻挑战。传统检测方法多依赖于手工特征与分类器组合,其泛化能力有限;近年来,随着深度学习的突破,尤其是基于卷积神经网络(CNN)的目标检测模型(如Faster R-CNN、YOLO、SSD等)显著提升了检测性能。

📌 2、数据集概览

项目 内容
数据集名称 车辆行人检测数据集
任务类型 目标检测(Object Detection)
类别 Person、Car
标注格式 YOLO TXT 格式(<类别> <中心x> <中心y> <宽度> <高度>,坐标和尺寸均为相对于图像宽高的归一化值(0-1))
图片总数 5607
标注总数 78507

🗂 3、数据详情

类别ID 类别名称 图片数量 标注数量
0 Person 3191 19784
1 Car 4930 58723
总计 - 5607 78507

✨ 4、效果演示

image.png

🧠 5、模型训练

1、安装miniconda
地址: https://repo.anaconda.com/miniconda/Miniconda3-latest-Windows-x86_64.exe
环境变量(根据实际的安装目录配置):

C:\ProgramData\miniconda3 
C:\ProgramData\miniconda3\Scripts 
C:\ProgramData\miniconda3\Library\bin 

2、创建虚拟环境

conda create -n yolo python==3.8
# 查看现有环境
conda env list
# 激活环境 
conda activate yolo
# 激活失败 (执行该命令后重新进入cmd)
conda init cmd.exe 

3、源码下载
https://github.com/ultralytics/ultralytics
(注意:不同版本的yolo在不同tag)

4、训练脚本

import warnings  
warnings.filterwarnings('ignore')  
from ultralytics import YOLO  
  
if __name__ == '__main__':  
    model = YOLO('ultralytics/cfg/models/v8/yolov8n.pt')  # 指定YOLO模型对象,并加载指定配置文件中的模型配置  
    # model.load('yolov8s.pt')      #加载预训练的权重文件'yolov8s.pt',加速训练并提升模型性能  
    model.train(data='ultralytics/cfg/datasets/data36.yaml',  # 指定训练数据集的配置文件路径,这个.yaml文件包含了数据集的路径和类别信息  
                cache=False,  # 是否缓存数据集以加快后续训练速度,False表示不缓存  
                imgsz=640,  # 指定训练时使用的图像尺寸,640表示将输入图像调整为640x640像素  
                epochs=100,  # 设置训练的总轮数为200轮  
                batch=8,  # 设置每个训练批次的大小为16,即每次更新模型时使用16张图片  
                close_mosaic=0,  # 设置在训练结束前多少轮关闭 Mosaic 数据增强,10 表示在训练的最后 10 轮中关闭 Mosaic                workers=16,  # 设置用于数据加载的线程数为8,更多线程可以加快数据加载速度  
                patience=300,  # 在训练时,如果经过50轮性能没有提升,则停止训练(早停机制)  
                device='0',  # 指定使用的设备,'0'表示使用第一块GPU进行训练  
                optimizer='SGD',  # 设置优化器为SGD(随机梯度下降),用于模型参数更新  
                )

5、配置文件 data.yaml

path: D:/data/yoloTrain/人车数据集
train: images/train
val: images/val
# number of classes
nc: 2
# class names
names: ["Person", "Car"]

🛠 6、配套服务

我们提供一站式视觉解决方案,包括:

  • 模型训练与调优指导
  • 部署环境远程配置
  • 定制标注与数据增强
  • 毕业设计/课题辅导
  • 企业项目合作开发

❓ 7、常见问题

Q:标注格式如何转换?
A:提供Python转换脚本,支持YOLO→VOC/COCO,开箱即用:点击下载转换脚本

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐