【超全总结】深度学习分割模型的损失函数类别及应用场景
《------往期经典推荐------》
二、机器学习实战专栏【链接】,已更新31期,欢迎关注,持续更新中~~
三、深度学习【Pytorch】专栏【链接】
四、【Stable Diffusion绘画系列】专栏【链接】
五、YOLOv8改进专栏【链接】,持续更新中~~
六、YOLO性能对比专栏【链接】,持续更新中~
《------正文------》
目录
引言

分割模型的目标是将图像的每个像素分类到预定义的类别中。
分割模型的损失函数量化了所有像素上预测标签和真实标签(地面实况)之间的差异。这种测量对于以下方面至关重要:
- 评估模型的性能
- 引导模型的学习过程
根据具体的挑战,如类别不平衡或对空间准确性的需求,采用不同的损失函数,这将在本文中进一步探讨。
1. Jaccard Loss或Intersection over Union(IoU)
Jaccard Loss测量预测分割和地面实况之间的相似性。
它的计算方法是1减去Jaccard指数(IoU)。这个损失函数是评估分割模型的一个常用指标,因为它直接量化了预测和实际分割的重叠程度,对于边界精度至关重要的任务非常有效。

P:预测值.GT:真实值
使用案例:非常适合预测分割和地面实况之间的重叠很重要的分割任务。
例如:地理成像和医学图像分割,因为精确划定边界在这两个领域都至关重要。
2.Dice Loss(F1-score)
Dice Loss类似于Jaccard损失。它对于具有不平衡类的数据特别有用。类别不平衡意味着图像中的某个感兴趣区域(或类别)比其他区域或类别更多。它本质上是用作损失函数的F1分数。
它同等对待假阳性和假阴性,并且对预测和实际分割图之间的交集大小敏感。

P:预测值|GT:真实值
用例:特别适用于处理图像中的类别不平衡。
例如:医学成像,其中感兴趣区域(如MRI扫描中的肿瘤)相对于背景可以占据图像的一小部分。
3.Binary Cross-Entropy Loss
二进制交叉熵损失(Binary Cross-Entropy Loss)测量图像中预测概率和实际二进制标签(地面实况)之间的像素差异。
这种损失用于二进制分割任务,其中每个像素被预测为属于0或1。图像中的每个像素通常被分类为属于前景或背景。

- N是图像中的像素总数。
- yi是像素xmi的实际标签,其可以是0(背景)或1(前景)。𝑖
- pi是像素P2i被分类为前景的预测概率(1)。𝑖
该公式根据预测概率与实际标签之间的差异计算每个像素的损失。对于每个像素,模型输出概率*pi*,指示像素属于前景的可能性。这是一个sigmoid激活+交叉熵损失。

用例:通常用于二进制分割任务,例如背景与前景分割,其中每个像素被分类为对象或非对象。
例如:文档扫描和简单的物体检测。
4.分类交叉熵损失
分类交叉熵损失(Categorical Cross-Entropy Loss)这种损失用于多类分割任务,其中每个像素可以属于几个类中的任何一个。
公式:
- C是类的数量。
- 如果类别标签pixel_c是像素pixel_i的正确分类,则pixel_c是二进制指示符(0或1)。
- pic是像素pici属于类别picc的预测概率。
损失的计算方法是取每个像素的真类的预测概率的负对数。一般来说,只有真正的类才对和有贡献,因为对于所有不正确的类,都是0。𝑦𝑖𝑐
用例:在需要在多个类别之间进行分类的场景中很有用。
例如:在单个卫星图像中分割道路,建筑物和植被,或在组织病理学生物医学图像中区分不同的细胞类型。
5.焦点损失Focal Loss
这种损失对于处理阶级不平衡特别有用。Focal Loss是对标准交叉熵损失的修改,它添加了一个聚焦参数来调整学习简单示例的速度,从而使其能够更多地关注难以分类的示例。

用例:在分割任务中的类之间存在显著不平衡的情况下非常有用。
示例:自动驾驶系统中的行人检测或医学成像中罕见的病理发现(感兴趣区域通常占据图像的一小部分)。
总结
这些损失函数中的每一个都解决了图像分割中面临的特定挑战,例如处理边界,改善类别不平衡,并确保准确预测每个像素的类别。
损失函数的选择会极大地影响分割模型的性能,因此了解其影响和用例对于实现高准确性和效率至关重要。

好了,这篇文章就介绍到这里,喜欢的小伙伴感谢给点个赞和关注,更多精彩内容持续更新~~
关于本篇文章大家有任何建议或意见,欢迎在评论区留言交流!
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐
所有评论(0)