伪装目标检测系列论文阅读:《Polyp-PVT:Polyp Segmentation with Paramid Vision Transformers》 基于金字塔视觉转换器的息肉-PVT分割
·
1.摘要
大多数息肉分割方法使用CNN作为主干,导致在解码器进行信息交换时需要考虑两个关键问题:
1)考虑不同层次特征之间的贡献差异
2)设计一种有效的融合机制
与现有的基于CNN的方法不同,我们采用了变换编码器,它学习更加强大和健壮的表示。此外,考虑到息肉图像的影响和难以捉摸的特性,我们引入了三个标准模块,包括级联融合模块,伪装识别模块和相似性聚合模块,其中,CFM用于从高层特征中收集息肉的语义和位置信息;CIM用于捕获隐藏在低层特征中的息肉信息,SAM将具有高级语义位置信息的息肉区域的像素特征扩展到息肉区域,从而有效地融合了跨层特征,提出的Polyp-PVT模型有效的抑制了特征中的噪声,显著提高了特征的表达能力。
在5个广泛采用的数据集上的大量实验表明,与现有的代表性方法相比,该模型对各种具有挑战性的情况具有更强的鲁棒性。
2.模型结构

3.方法/实验
使用并行解码器预测粗略区域,并使用注意力机制恢复息肉的边缘和内部结构以进行细粒度分割。
4.结果/发现
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐
所有评论(0)