📦点击查看-已发布目标检测数据集合集(持续更新)

数据集名称 图像数量 应用方向 博客链接
🔌 电网巡检检测数据集 1600 张 电力设备目标检测 点击查看
🔥 火焰 / 烟雾 / 人检测数据集 10000张 安防监控,多目标检测 点击查看
🚗 高质量车牌识别数据集 10,000 张 交通监控 / 车牌识别 点击查看
🌿 农田杂草航拍检测数据集 1,200 张 农业智能巡检 点击查看
🐑 航拍绵羊检测数据集 1,700 张 畜牧监控 / 航拍检测 点击查看


更多数据集可点击此链接
在这里插入图片描述

🐠 鱼类健康状态检测数据集介绍

📌 数据集概览

本项目是专注于水产养殖与观赏鱼健康的计算机视觉数据集,共包含约 698 张高分辨率鱼类图像,主要用于训练深度学习模型对鱼类的健康状态进行二分类识别。该数据集为智能水产养殖、水族馆管理和鱼类疾病早期预警提供了高质量的训练基础。

  • 图像数量:1698 张
  • 类别数:2 类
  • 适用任务:图像分类(Image Classification)
  • 适配模型:ResNet、EfficientNet、MobileNet、Vision Transformer 等主流分类架构

包含类别

类别 英文名称 描述
健康鱼 healthy-fish 体表光滑、色泽正常、无明显病灶或损伤的健康个体
病鱼 sick-fish 体表出现溃烂、出血、霉斑、寄生虫附着、肿胀等异常症状的患病个体

数据集覆盖多种常见淡水鱼种的健康与病态表现,能够显著提升AI模型在水产养殖管理中的自动化监测能力与疾病预警效率。

🎯 应用场景

该数据集非常适用于以下农业与研究领域:

  • 智能水产养殖系统
    自动识别池塘或循环水系统中病鱼,及时隔离并预警,减少大规模死亡损失。

  • 水族馆健康管理
    辅助管理员监控观赏鱼健康状况,实现早发现、早治疗,降低死亡率。

  • 渔业科研与教学
    作为鱼类病理学研究和兽医培训的教学材料,帮助快速识别典型病症。

  • 电商平台验货
    在线上销售活鱼时,自动评估鱼只健康状态,提升消费者信任度。

  • 智能投喂设备联动
    与自动投喂系统结合,在检测到病鱼时调整投喂策略或暂停投喂。

  • 水质与疾病关联分析
    结合环境传感器数据,研究水质变化与鱼类健康状态的相关性。

🖼 数据样本展示

以下展示部分数据集内的样本图片(均为真实鱼类拍摄):
在这里插入图片描述
在这里插入图片描述

数据集包含多种真实养殖与自然环境下的鱼类图像:

  • 多鱼种覆盖:金鱼、锦鲤、鲫鱼、罗非鱼等多种常见淡水鱼
  • 多病症表现:涵盖真菌感染、细菌性溃疡、寄生虫、外伤等多种病理特征
  • 不同拍摄环境:水下、水面、手持特写、背景板等多种拍摄条件
  • 不同光照条件:自然光、人工光源、水下光线折射等
  • 清晰病灶特写:部分图像聚焦于病变部位,便于模型学习关键特征

图像来源于真实病例采集,具有高度的实用价值和挑战性,特别适合训练鲁棒性强的动物健康识别模型。

使用建议

  1. 数据预处理优化

    • 标准化色彩空间,减少水体浑浊或反射干扰
    • 应用直方图均衡化或CLAHE增强病灶细节对比度
    • 统一图像尺寸(推荐224x224或512x512),保持鱼体主体居中
  2. 模型训练策略

    • 使用在ImageNet上预训练的模型进行迁移学习
    • 采用分层学习率或余弦退火策略提升收敛效果
    • 针对小样本类别使用过采样或Focal Loss缓解不平衡问题
  3. 实际部署考虑

    • 边缘设备优化:针对养殖场摄像头或手机App进行轻量化部署
    • 实时推理能力:优化模型延迟,满足现场快速诊断需求
    • 离线可用性:支持无网络环境下的本地运行
  4. 应用场景适配

    • 移动端集成:开发微信小程序或独立App,支持养殖户自助拍摄分析
    • 养殖场监控对接:与现有视频监控系统无缝集成,实现自动报警
    • 云端API服务:提供批量上传和自动分类的云服务接口
  5. 性能监控与改进

    • 建立按鱼种和病症划分的性能评估矩阵
    • 收集易混淆样本(如轻微寄生虫与正常鳞片、初期溃疡与擦伤)进行模型强化
    • 定期更新模型以适应新的病原体变异和养殖环境

🌟 数据集特色

  • 临床真实性:所有图像来自真实病例,非合成或模拟数据
  • 标注专业性:由水产兽医或经验丰富的养殖人员审核确认
  • 病症代表性:涵盖多种高发、高致死率的鱼类疾病类型
  • 技术兼容性:支持主流深度学习框架与移动端部署方案
  • 持续维护:定期更新并扩展新病例,保持数据集时效性

📈 商业价值

该数据集在以下商业领域具有重要价值:

  • 水产科技公司:构建核心健康监测引擎,提升产品竞争力
  • 智能养殖设备商:集成到水质监控或投喂系统中,提供增值服务
  • 水族馆与宠物店:用于客户咨询与售后服务,提高专业形象
  • 渔业保险公司:用于灾害定损与风险评估,提高理赔效率

🔗 技术标签

计算机视觉 图像分类 鱼类健康 水产养殖 疾病检测 深度学习 ResNet 农业AI 智能监控 水族管理


注意: 本数据集仅限于农业研究、教育及商业开发用途。在实际生产中应用时,应结合专业兽医意见进行综合判断,避免单一依赖AI诊断结果。

YOLOv8 训练实战

本教程介绍如何使用 YOLOv8 对目标进行识别与检测。涵盖环境配置、数据准备、训练模型、模型推理和部署等全过程。


📦 1. 环境配置

建议使用 Python 3.8+,并确保支持 CUDA 的 GPU 环境。

# 创建并激活虚拟环境(可选)
python -m venv yolov8_env
source yolov8_env/bin/activate  # Windows 用户使用 yolov8_env\Scripts\activate

安装 YOLOv8 官方库 ultralytics

pip install ultralytics

📁 2. 数据准备

2.1 数据标注格式(YOLO)

每张图像对应一个 .txt 文件,每行代表一个目标,格式如下:

<class_id> <x_center> <y_center> <width> <height>

所有值为相对比例(0~1)。

类别编号从 0 开始。

2.2 文件结构示例

datasets/
├── images/
│   ├── train/
│   └── val/
├── labels/
│   ├── train/
│   └── val/

2.3 创建 data.yaml 配置文件

path: ./datasets
train: images/train
val: images/val

nc: 11
names: ['Bent_Insulator', 'Broken_Insulator_Cap', '', ...]

🚀 3. 模型训练

YOLOv8 提供多种模型:yolov8n, yolov8s, yolov8m, yolov8l, yolov8x。可根据设备性能选择。

yolo detect train \
  model=yolov8s.pt \
  data=./data.yaml \
  imgsz=640 \
  epochs=50 \
  batch=16 \
  project=weed_detection \
  name=yolov8s_crop_weed
参数 类型 默认值 说明
model 字符串 - 指定基础模型架构文件或预训练权重文件路径(.pt/.yaml
data 字符串 - 数据集配置文件路径(YAML 格式),包含训练/验证路径和类别定义
imgsz 整数 640 输入图像的尺寸(像素),推荐正方形尺寸(如 640x640)
epochs 整数 100 训练总轮次,50 表示整个数据集会被迭代 50 次
batch 整数 16 每个批次的样本数量,值越大需要越多显存
project 字符串 - 项目根目录名称,所有输出文件(权重/日志等)将保存在此目录下
name 字符串 - 实验名称,用于在项目目录下创建子文件夹存放本次训练结果

关键参数补充说明:

  1. model=yolov8s.pt

    • 使用预训练的 YOLOv8 small 版本(平衡速度与精度)
    • 可用选项:yolov8n.pt(nano)/yolov8m.pt(medium)/yolov8l.pt(large)
  2. data=./data.yaml

    # 典型 data.yaml 结构示例
    path: ../datasets/weeds
    train: images/train
    val: images/val
    names:
      0: Bent_Insulator
      1: Broken_Insulator_Cap
      2: ...
      3: ...
    

📈 4. 模型验证与测试

4.1 验证模型性能

yolo detect val \
  model=runs/detect/yolov8s_crop_weed/weights/best.pt \
  data=./data.yaml
参数 类型 必需 说明
model 字符串 要验证的模型权重路径(通常为训练生成的 best.ptlast.pt
data 字符串 与训练时相同的 YAML 配置文件路径,需包含验证集路径和类别定义

关键参数详解

  1. model=runs/detect/yolov8s_crop_weed/weights/best.pt

    • 使用训练过程中在验证集表现最好的模型权重(best.pt
    • 替代选项:last.pt(最终epoch的权重)
    • 路径结构说明:
      runs/detect/
      └── [训练任务名称]/
          └── weights/
              ├── best.pt   # 验证指标最优的模型
              └── last.pt   # 最后一个epoch的模型
      
  2. data=./data.yaml

    • 必须与训练时使用的配置文件一致
    • 确保验证集路径正确:
      val: images/val  # 验证集图片路径
      names:
        0: crop
        1: weed
      

常用可选参数

参数 示例值 作用
batch 16 验证时的批次大小
imgsz 640 输入图像尺寸(需与训练一致)
conf 0.25 置信度阈值(0-1)
iou 0.7 NMS的IoU阈值
device 0/cpu 选择计算设备
save_json True 保存结果为JSON文件

典型输出指标

Class     Images  Instances      P      R      mAP50  mAP50-95
all        100       752      0.891  0.867    0.904    0.672
crop       100       412      0.912  0.901    0.927    0.701
weed       100       340      0.870  0.833    0.881    0.643

4.2 推理测试图像

yolo detect predict \
  model=runs/detect/yolov8s_crop_weed/weights/best.pt \
  source=./datasets/images/val \
  save=True

🧠 5. 自定义推理脚本(Python)

from ultralytics import YOLO
import cv2

# 加载模型
model = YOLO('runs/detect/yolov8s_crop_weed/weights/best.pt')

# 推理图像
results = model('test.jpg')

# 可视化并保存结果
results[0].show()
results[0].save(filename='result.jpg')

🛠 6. 部署建议

✅ 本地运行:通过 Python 脚本直接推理。

🌐 Web API:可用 Flask/FastAPI 搭建检测接口。

📦 边缘部署:YOLOv8 支持导出为 ONNX,便于在 Jetson、RKNN 等平台上部署。

导出示例:

yolo export model=best.pt format=onnx

📌 总结流程

阶段 内容
✅ 环境配置 安装 ultralytics, PyTorch 等依赖
✅ 数据准备 标注图片、组织数据集结构、配置 YAML
✅ 模型训练 使用命令行开始训练 YOLOv8 模型
✅ 验证评估 检查模型准确率、mAP 等性能指标
✅ 推理测试 运行模型检测实际图像目标
✅ 高级部署 导出模型,部署到 Web 或边缘设备
Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐