前言

个人记录。为了记忆用的。

里面包含了跑通一个yolov8模型的需要更改的代码、连接服务器的用法、遇到的bug、数据集的制作以及数据集格式的转换


提示:以下是本篇文章正文内容,下面案例可供参考

一、数据集的制作

  1. 用的软件:labelme
  2. labelme生成的是json文件,不符合yolo所用的数据集格式(.txt)
  3. 利用代码进行格式转换,并将数据集分为测试(test)、验证(val)、训练(train)
  4. 注意:分割的和检测所用的.txt并不是一样的,也就是转换的代码也不同。

(分割)json格式转换txt格式代码

  • 运行时候更改defalut后面的json文件地址和保存生成txt文件地址。以及class中的类别
import json
import os
import argparse
from tqdm import tqdm

def convert_label_json(json_dir, save_dir, classes):
    json_paths = os.listdir(json_dir)
    classes = classes.split(',')

    for json_path in tqdm(json_paths):
        path = os.path.join(json_dir, json_path)
        with open(path, 'r') as load_f:
            json_dict = json.load(load_f)
        h, w = json_dict['imageHeight'], json_dict['imageWidth']

        # 保存 txt 的路径
        txt_path = os.path.join(save_dir, json_path.replace('json', 'txt'))

        # 确保目标目录存在
        os.makedirs(os.path.dirname(txt_path), exist_ok=True)

        try:
            with open(txt_path, 'w') as txt_file:
                for shape_dict in json_dict['shapes']:
                    label = shape_dict['label']
                    label_index = classes.index(label)
                    points = shape_dict['points']

                    points_nor_list = []
                    for point in points:
                        points_nor_list.append(point[0] / w)
                        points_nor_list.append(point[1] / h)

                    points_nor_list = list(map(lambda x: str(x), points_nor_list))
                    points_nor_str = ' '.join(points_nor_list)

                    label_str = str(label_index) + ' ' + points_nor_str + '\n'
                    txt_file.write(label_str)
        except Exception as e:
            print(f"Error writing to {txt_path}: {e}")

if __name__ == "__main__":
    """
    python json2txt_nomalize.py --json-dir my_datasets/color_rings/jsons --save-dir my_datasets/color_rings/txts --classes "cat,dogs"
    """
    parser = argparse.ArgumentParser(description='json convert to txt params')
    parser.add_argument('--json-dir', type=str, default='',
                        help='json path dir')
    parser.add_argument('--save-dir', type=str, default='',
                        help='txt save dir')
    parser.add_argument('--classes', type=str, default=' ', help='classes')
    args = parser.parse_args()
    json_dir = args.json_dir
    save_dir = args.save_dir
    classes = args.classes
    convert_label_json(json_dir, save_dir, classes)

(分割)将数据集进行划分

同样自己运行时更改地址和类别。

# 将图片和标注数据按比例切分为 训练集和测试集
import shutil
import random
import os
import argparse


# 检查文件夹是否存在
def mkdir(path):
    if not os.path.exists(path):
        os.makedirs(path)


def main(image_dir, txt_dir, save_dir):
    # 创建文件夹
    mkdir(save_dir)
    images_dir = os.path.join(save_dir, 'images')
    labels_dir = os.path.join(save_dir, 'labels')

    img_train_path = os.path.join(images_dir, 'train')
    img_test_path = os.path.join(images_dir, 'test')
    img_val_path = os.path.join(images_dir, 'val')

    label_train_path = os.path.join(labels_dir, 'train')
    label_test_path = os.path.join(labels_dir, 'test')
    label_val_path = os.path.join(labels_dir, 'val')

    mkdir(images_dir);
    mkdir(labels_dir);
    mkdir(img_train_path);
    mkdir(img_test_path);
    mkdir(img_val_path);
    mkdir(label_train_path);
    mkdir(label_test_path);
    mkdir(label_val_path);

    # 数据集划分比例,训练集80%,验证集10%,测试集10%,按需修改
    train_percent = 0.8
    val_percent = 0.1
    test_percent = 0.1

    total_txt = os.listdir(txt_dir)
    num_txt = len(total_txt)
    list_all_txt = range(num_txt)  # 范围 range(0, num)

    num_train = int(num_txt * train_percent)
    num_val = int(num_txt * val_percent)
    num_test = num_txt - num_train - num_val

    train = random.sample(list_all_txt, num_train)
    # 在全部数据集中取出train
    val_test = [i for i in list_all_txt if not i in train]
    # 再从val_test取出num_val个元素,val_test剩下的元素就是test
    val = random.sample(val_test, num_val)

    print("训练集数目:{}, 验证集数目:{},测试集数目:{}".format(len(train), len(val), len(val_test) - len(val)))
    for i in list_all_txt:
        name = total_txt[i][:-4]

        srcImage = os.path.join(image_dir, name + '.jpg')
        srcLabel = os.path.join(txt_dir, name + '.txt')

        if i in train:
            dst_train_Image = os.path.join(img_train_path, name + '.jpg')
            dst_train_Label = os.path.join(label_train_path, name + '.txt')
            shutil.copyfile(srcImage, dst_train_Image)
            shutil.copyfile(srcLabel, dst_train_Label)
        elif i in val:
            dst_val_Image = os.path.join(img_val_path, name + '.jpg')
            dst_val_Label = os.path.join(label_val_path, name + '.txt')
            shutil.copyfile(srcImage, dst_val_Image)
            shutil.copyfile(srcLabel, dst_val_Label)
        else:
            dst_test_Image = os.path.join(img_test_path, name + '.jpg')
            dst_test_Label = os.path.join(label_test_path, name + '.txt')
            shutil.copyfile(srcImage, dst_test_Image)
            shutil.copyfile(srcLabel, dst_test_Label)


if __name__ == '__main__':
    """
    python split_datasets.py --image-dir my_datasets/color_rings/imgs --txt-dir my_datasets/color_rings/txts --save-dir my_datasets/color_rings/train_data
    """
    parser = argparse.ArgumentParser(description='split datasets to train,val,test params')
    parser.add_argument('--image-dir', type=str, default='',
                        help='image path dir')
    parser.add_argument('--txt-dir', type=str, default='',
                        help='txt path dir')
    parser.add_argument('--save-dir', default='', type=str,
                        help='save dir')
    args = parser.parse_args()
    image_dir = args.image_dir
    txt_dir = args.txt_dir
    save_dir = args.save_dir

    main(image_dir, txt_dir, save_dir)

二、需要更改的代码

1.yaml文件

复制一个yaml文件,将内容更改为如下所示:

  • train、val、test的地址进行修改
  • nc是类别,有几个类别就写几,这里我加上了背景是两类
  • names是类别名称,要和json文件中的,进行标注时候的类别进行对应,background这个我不知道不加会不会报错,是背景。
## coco8-seg.yaml 示例
train:                                   # 训练图像路径
val:                                        # 验证图像路径
test:                              # 测试图像路径(可选)
nc: 2  # 类别数
names: ['di','background']  # 类别名称列表

2.train 文件

如果下载的代码中没有train文件,可以自己建一个python文件

  • 其中fengedi.yaml是我的yaml文件,需要更改为自己。
  • 这个分割的,如果是检测的,在model这里要将.yaml和.pt文件更改成相应的,可以在下图找到.pt这个是预训练权重文件,在这个网址https://docs.ultralytics.com/zh/models/yolov8中可以进行下载,下载后放在项目根目录中。

from ultralytics import YOLO
import torch
import wandb

# Load a model
model = YOLO("yolov8n-seg.yaml")  # build a new model from scratch

model.load('yolov8n-seg.pt')
# Use the model
if __name__ == '__main__':
    torch.cuda.device_count()
    model.train(data="fengedi.yaml", epochs=500)  # train the model
    metrics = model.val()  # evaluate model performance on the validation set

    wandb.init(allow_none=True)  # Allow running without logging in

3、val验证代码,没有的话自己建一个。路径自己更改。

from ultralytics import YOLO
import torch
import torch.nn as nn
# Load a model
# model = YOLO('yolov8.pt')  # load an official model

model = YOLO('路径')
# source 后是测试集的路径   name参数后面路径是把预测的结果放到哪里
results=model.predict(source='路径',save=True,
              show=False,name="参数路径")

三、连接服务器的方法

准备

XFTP连接传文件

1、新建连接

2、输入主机号和端口号

这里点一次性接受

3、连接上的界面,然后将自己的代码传过去就可以了

Xshell运行代码

1、连接,输入主机号、端口号

2、连接上界面

切换环境:source activate 环境名

切换路径:cd   路径

运行代码:python train.py 

 这里的路径是传输代码到服务器上的,服务器的上代码路径。例如:

注意:在服务器运行时候,需要更改yaml中文件的地址(改成服务器上存放的地址),再上传过去服务器,将原本的覆盖以后才可以运行pthon train.py

四、遇到的问题

wandb.errors.UsageError: api_key not configured (no-tty). call wandb.login(key=[your_api

wandb_key的错误

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐