关键词:医学图像分割(Medical Image Segmentation)、解码器设计(Decoder Design)、深度到空间上采样(Depth-to-Space Upsampling)、残差线性注意力(Residual Linear Attention)、通道与空间注意力(Channel and Spatial Attention)、多尺度特征融合(Multi-scale Feature Fusion)

一、导读

在医学图像分析中,精准地分割出生物标志物(如细胞核、线粒体)对疾病诊断至关重要。然而,由于图像中目标大小不一、边界模糊、染色差异大,现有的分割模型往往难以准确提取特征,尤其是在数据量有限的情况下。许多先进方法依赖预训练的编码器,但解码部分效率不高,导致信息丢失,分割效果不理想。

为了解决这些问题,本文提出了一种名为MCADS的新型解码器结构,它通过深度到空间上采样注意力机制来更好地融合多尺度特征,提升分割精度。实验表明,该方法在多个公开数据集上显著优于现有最优模型,平均提升约3%的IoU指标。

原文、这里:CVPR'25 医图论文|医学图像分割新突破:MCADS以多尺度融合+残差注意力,精准分割生物标志物

二、论文基本信息

  • 论文标题:Rethinking Decoder Design: Improving Biomarker Segmentation Using Depth-to-Space Restoration and Residual Linear Attention

  • 作者姓名与单位:Saad Wazir, Daeyoung Kim(KAIST)

  • 发表日期与会议/期刊来源:CVPR 2025

  • 论文链接:https://github.com/saadwazir/MCADS-Decoder

三、主要贡献与创新

  1. 提出MCADS解码器,融合多尺度特征并引入深度到空间上采样。

  2. 设计残差线性注意力块(RLAB),增强编码器与解码器特征融合。

  3. 提出通道与空间注意力块(CASAB),强化关键通道与区域。

  4. 改进U2-Net编码器,增强多尺度上下文信息提取能力。

  5. 通过大量实验验证方法在多个数据集上的优越性与鲁棒性。

原文、这里:CVPR'25 医图论文|医学图像分割新突破:MCADS以多尺度融合+残差注意力,精准分割生物标志物https://mp.weixin.qq.com/s/Jb9OcEaRkHjOeCGk7NZxuA

四、研究方法与原理

本文核心思路是通过新型解码器设计,更好地融合编码器提取的多尺度特征,并利用注意力机制强化关键信息,提升分割精度。

  • 卷积块(Convolution Block, CB)使用深度可分离卷积减少参数量,公式为:

  • 深度到空间上采样块(DSUB)通过  操作恢复空间细节,公式为:

  • 有效上采样块(EUB)结合双线性插值与卷积块,减少噪声:

  • 通道与空间注意力块(CASAB)融合通道与空间注意力,公式为:

    其中  和  分别使用全局池化与多类型池化操作。

  • 残差线性注意力块(RLAB)通过残差连接与自注意力机制融合编码器与解码器特征:

    其中  为自注意力计算。

五、实验设计与结果分析

  • 数据集与评测指标使用 MoNuSeg、DSB、Electron Microscopy、TNBC 四个公开数据集,评测指标包括 IoU、Dice、Precision、Recall、FOR、HD95、ASD。

  • 对比实验表1-4展示了在四个数据集上的对比结果,MCADS 在 IoU、Dice、HD95 等指标上均优于现有方法,如 U-Net、Hover-Net、EMCAD 等。

  • 可视化对比图4展示了分割结果的可视化对比,红色框标出错误预测区域,MCADS 在边界细节上表现更优。

  • 消融实验表5-8分别验证了编码器改进、DSUB/EUB 模块、RLAB 与 CASAB 的有效性。例如,表8显示逐步加入各模块后 IoU 从 69.03 提升至 74.04。

六、论文结论与评价

『 往期推荐 』

CVPR'25医图论文|全切片图像分类新范式!MExD 首提 “专家注入扩散” 架构,WSI 分类精度碾压 12 种 SOTA

MICCAI 2025|脑病变分割重大突破!牛津团队U-Net 创新:模态无关通道+影像合成,训练外序列也能精准分割

赞啊!3D医学影像分析CVPR/ICML/TMI 2025顶会新成果!

医图论文 ICCV'25 | 太顶了!M-Net:时序处理+TPS双 buff,MRI 脑肿瘤登顶 SOTA!

别再卷传统分割了!ICCV'25 新宠 TextSAM-EUS:零手动标注,文本驱动 SAM 搞定超声胰腺肿瘤分割

刷屏 CVPR 2025!医学影像 + 多模态,这些创新方向绝对是当下发文好方向!

CVPR'25 重磅!SKCDF 框架破解医学分割痛点:数据流解耦 + 知识互补,小器官 Dice 飙升 10%+

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐