伪装目标检测系列论文阅读：《Polyp-PVT:Polyp Segmentation with Paramid Vision Transformers》基于金字塔视觉转换器的息肉-PVT分割

交换喜悲

899人浏览 · 2024-01-22 01:52:12

交换喜悲 · 2024-01-22 01:52:12 发布

1.摘要

大多数息肉分割方法使用CNN作为主干，导致在解码器进行信息交换时需要考虑两个关键问题：
1）考虑不同层次特征之间的贡献差异
2）设计一种有效的融合机制
与现有的基于CNN的方法不同，我们采用了变换编码器，它学习更加强大和健壮的表示。此外，考虑到息肉图像的影响和难以捉摸的特性，我们引入了三个标准模块，包括级联融合模块，伪装识别模块和相似性聚合模块，其中，CFM用于从高层特征中收集息肉的语义和位置信息；CIM用于捕获隐藏在低层特征中的息肉信息，SAM将具有高级语义位置信息的息肉区域的像素特征扩展到息肉区域，从而有效地融合了跨层特征，提出的Polyp-PVT模型有效的抑制了特征中的噪声，显著提高了特征的表达能力。
在5个广泛采用的数据集上的大量实验表明，与现有的代表性方法相比，该模型对各种具有挑战性的情况具有更强的鲁棒性。

2.模型结构

在这里插入图片描述

3.方法/实验

使用并行解码器预测粗略区域，并使用注意力机制恢复息肉的边缘和内部结构以进行细粒度分割。

4.结果/发现

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

使用概率图路径规划的机器人路径规划研究Octave（Matlab代码实现）

针对复杂未知环境下传统机器人路径规划算法适应性差、避障稳定性弱、全局搜索效率低的问题，本文开展基于概率图的机器人路径规划方法研究。概率图路径规划依托概率路线图建模思想，通过环境随机采样、节点连通性构建、最优路径检索的核心逻辑，摆脱了传统算法对环境精准建模的依赖，具备强环境适配性与高运算效率。本文系统阐述概率图路径规划的核心理论、运行机制与技术优势，基于Octave仿真平台搭建多场景机器人运动规划仿