YOLOV8跑自己的数据集（语义分割）

import json
import os
import argparse
from tqdm import tqdm

def convert_label_json(json_dir, save_dir, classes):
    json_paths = os.listdir(json_dir)
    classes = classes.split(',')

    for json_path in tqdm(json_paths):
        path = os.path.join(json_dir, json_path)
        with open(path, 'r') as load_f:
            json_dict = json.load(load_f)
        h, w = json_dict['imageHeight'], json_dict['imageWidth']

        # 保存 txt 的路径
        txt_path = os.path.join(save_dir, json_path.replace('json', 'txt'))

        # 确保目标目录存在
        os.makedirs(os.path.dirname(txt_path), exist_ok=True)

        try:
            with open(txt_path, 'w') as txt_file:
                for shape_dict in json_dict['shapes']:
                    label = shape_dict['label']
                    label_index = classes.index(label)
                    points = shape_dict['points']

                    points_nor_list = []
                    for point in points:
                        points_nor_list.append(point[0] / w)
                        points_nor_list.append(point[1] / h)

                    points_nor_list = list(map(lambda x: str(x), points_nor_list))
                    points_nor_str = ' '.join(points_nor_list)

                    label_str = str(label_index) + ' ' + points_nor_str + '\n'
                    txt_file.write(label_str)
        except Exception as e:
            print(f"Error writing to {txt_path}: {e}")

if __name__ == "__main__":
    """
    python json2txt_nomalize.py --json-dir my_datasets/color_rings/jsons --save-dir my_datasets/color_rings/txts --classes "cat,dogs"
    """
    parser = argparse.ArgumentParser(description='json convert to txt params')
    parser.add_argument('--json-dir', type=str, default='',
                        help='json path dir')
    parser.add_argument('--save-dir', type=str, default='',
                        help='txt save dir')
    parser.add_argument('--classes', type=str, default=' ', help='classes')
    args = parser.parse_args()
    json_dir = args.json_dir
    save_dir = args.save_dir
    classes = args.classes
    convert_label_json(json_dir, save_dir, classes)

（分割）将数据集进行划分

同样自己运行时更改地址和类别。

# 将图片和标注数据按比例切分为 训练集和测试集
import shutil
import random
import os
import argparse


# 检查文件夹是否存在
def mkdir(path):
    if not os.path.exists(path):
        os.makedirs(path)


def main(image_dir, txt_dir, save_dir):
    # 创建文件夹
    mkdir(save_dir)
    images_dir = os.path.join(save_dir, 'images')
    labels_dir = os.path.join(save_dir, 'labels')

    img_train_path = os.path.join(images_dir, 'train')
    img_test_path = os.path.join(images_dir, 'test')
    img_val_path = os.path.join(images_dir, 'val')

    label_train_path = os.path.join(labels_dir, 'train')
    label_test_path = os.path.join(labels_dir, 'test')
    label_val_path = os.path.join(labels_dir, 'val')

    mkdir(images_dir);
    mkdir(labels_dir);
    mkdir(img_train_path);
    mkdir(img_test_path);
    mkdir(img_val_path);
    mkdir(label_train_path);
    mkdir(label_test_path);
    mkdir(label_val_path);

    # 数据集划分比例，训练集80%，验证集10%，测试集10%，按需修改
    train_percent = 0.8
    val_percent = 0.1
    test_percent = 0.1

    total_txt = os.listdir(txt_dir)
    num_txt = len(total_txt)
    list_all_txt = range(num_txt)  # 范围 range(0, num)

    num_train = int(num_txt * train_percent)
    num_val = int(num_txt * val_percent)
    num_test = num_txt - num_train - num_val

    train = random.sample(list_all_txt, num_train)
    # 在全部数据集中取出train
    val_test = [i for i in list_all_txt if not i in train]
    # 再从val_test取出num_val个元素，val_test剩下的元素就是test
    val = random.sample(val_test, num_val)

    print("训练集数目：{}, 验证集数目：{},测试集数目：{}".format(len(train), len(val), len(val_test) - len(val)))
    for i in list_all_txt:
        name = total_txt[i][:-4]

        srcImage = os.path.join(image_dir, name + '.jpg')
        srcLabel = os.path.join(txt_dir, name + '.txt')

        if i in train:
            dst_train_Image = os.path.join(img_train_path, name + '.jpg')
            dst_train_Label = os.path.join(label_train_path, name + '.txt')
            shutil.copyfile(srcImage, dst_train_Image)
            shutil.copyfile(srcLabel, dst_train_Label)
        elif i in val:
            dst_val_Image = os.path.join(img_val_path, name + '.jpg')
            dst_val_Label = os.path.join(label_val_path, name + '.txt')
            shutil.copyfile(srcImage, dst_val_Image)
            shutil.copyfile(srcLabel, dst_val_Label)
        else:
            dst_test_Image = os.path.join(img_test_path, name + '.jpg')
            dst_test_Label = os.path.join(label_test_path, name + '.txt')
            shutil.copyfile(srcImage, dst_test_Image)
            shutil.copyfile(srcLabel, dst_test_Label)


if __name__ == '__main__':
    """
    python split_datasets.py --image-dir my_datasets/color_rings/imgs --txt-dir my_datasets/color_rings/txts --save-dir my_datasets/color_rings/train_data
    """
    parser = argparse.ArgumentParser(description='split datasets to train,val,test params')
    parser.add_argument('--image-dir', type=str, default='',
                        help='image path dir')
    parser.add_argument('--txt-dir', type=str, default='',
                        help='txt path dir')
    parser.add_argument('--save-dir', default='', type=str,
                        help='save dir')
    args = parser.parse_args()
    image_dir = args.image_dir
    txt_dir = args.txt_dir
    save_dir = args.save_dir

    main(image_dir, txt_dir, save_dir)

二、需要更改的代码

1.yaml文件

复制一个yaml文件，将内容更改为如下所示:

train、val、test的地址进行修改
nc是类别，有几个类别就写几，这里我加上了背景是两类
names是类别名称，要和json文件中的，进行标注时候的类别进行对应，background这个我不知道不加会不会报错，是背景。

## coco8-seg.yaml 示例
train:                                   # 训练图像路径
val:                                        # 验证图像路径
test:                              # 测试图像路径（可选）
nc: 2  # 类别数
names: ['di','background']  # 类别名称列表

2.train 文件

如果下载的代码中没有train文件，可以自己建一个python文件

其中fengedi.yaml是我的yaml文件，需要更改为自己。
这个分割的，如果是检测的，在model这里要将.yaml和.pt文件更改成相应的，可以在下图找到.pt这个是预训练权重文件，在这个网址https://docs.ultralytics.com/zh/models/yolov8中可以进行下载，下载后放在项目根目录中。


from ultralytics import YOLO
import torch
import wandb

# Load a model
model = YOLO("yolov8n-seg.yaml")  # build a new model from scratch

model.load('yolov8n-seg.pt')
# Use the model
if __name__ == '__main__':
    torch.cuda.device_count()
    model.train(data="fengedi.yaml", epochs=500)  # train the model
    metrics = model.val()  # evaluate model performance on the validation set

    wandb.init(allow_none=True)  # Allow running without logging in

3、val验证代码，没有的话自己建一个。路径自己更改。

from ultralytics import YOLO
import torch
import torch.nn as nn
# Load a model
# model = YOLO('yolov8.pt')  # load an official model

model = YOLO('路径')
# source 后是测试集的路径   name参数后面路径是把预测的结果放到哪里
results=model.predict(source='路径',save=True,
              show=False,name="参数路径")