【论文解读|滑坡检测·U-Net·语义分割· 深度学习·遥感·中分辨率影像】基于双编码器 U-Net 的滑坡检测方法:融合 Sentinel-2 影像与 DEM 数据(五)
【论文解读|滑坡检测·U-Net·语义分割· 深度学习·遥感·中分辨率影像】基于双编码器 U-Net 的滑坡检测方法:融合 Sentinel-2 影像与 DEM 数据(五)
【论文解读|滑坡检测·U-Net·语义分割· 深度学习·遥感·中分辨率影像】基于双编码器 U-Net 的滑坡检测方法:融合 Sentinel-2 影像与 DEM 数据(五)
文章目录
欢迎铁子们点赞、关注、收藏!
祝大家逢考必过!逢投必中!上岸上岸上岸!upupup
大多数高校硕博生毕业要求需要参加学术会议,发表EI或者SCI检索的学术论文会议论文。详细信息可关注VX “
学术会议小灵通”或参考学术信息专栏:https://blog.csdn.net/2401_89898861/article/details/145551342
论文地址:DOI 10.1007/s10346-023-02089-5
3 方法:数据预处理
3.3 模型构建
3.3.2 带注意力机制的解码路径(Decoding Path with Attention)
解码器由 上采样层 和 卷积层 组成,其中,上采样层对编码器的特征图进行重缩放,并通过卷积层优化特征。通过堆叠上采样层与卷积层,解码器逐步重建图像目标并突出目标特征。本网络包含 四个解码块(decoder blocks),每个解码块由 一层上采样层 和 两层卷积层 组成,以更新特征并调整通道数。在最终解码块中,使用 1×1 卷积层 进行分类映射,最终在每个像素位置生成与类别数相同长度的特征向量。
U 形网络(U-Net)通常采用 跳跃连接(skip connection) 以拼接编码器与解码器对应层的特征,从而在上采样后保留更多高分辨率细节。本研究在跳跃连接中引入 自注意力(self-attention) 模块(Oktay 等,2018),以增强特征融合,使模型聚焦于目标信息,同时抑制无关背景信息(如图 5)。
在 图 5 中:
- X 表示来自解码块的上采样特征图;
- H 表示来自对应编码块的特征图;
- m 为特征图尺寸;
- d_h 和 d_x 分别表示 H 和 X 的通道数;
- d_int 和 d_out 分别表示 中间特征通道数 和 输出特征通道数。
首先,H 和 X 经过 1×1 卷积层 更新,生成的特征图进行逐元素加法,得到中间特征图,再经 1×1 卷积层 计算 注意力系数 P。接着,输入 X 乘以 P,并与 H 进行拼接,最终生成融合后的输出特征图。
3.3.3 损失函数(Loss Function)
- 本网络采用 联合损失函数 L L L 进行训练,结合 加权交叉熵损失(Weighted Cross Entropy, WCE)
L W C E L_{WCE} LWCE 和 Dice 损失(Dice Loss) L D i c e L_{Dice} LDice 的优势。其中,交叉熵损失 具有良好的可优化性,而 Dice 损失 可有效缓解类别不均衡问题。因此,综合损失函数 L L L 兼具两者优点,其计算公式如下:
其中, λ ∈ [ 0 , 1 ] λ∈[0,1] λ∈[0,1] 为平衡参数。
加权交叉熵损失(Weighted Cross Entropy, WCE)
- 加权交叉熵损失是交叉熵损失的变体(Phan & Yamamoto, 2020),用于缓解类别不均衡问题,其计算公式如下:
其中: N N N 为训练样本数, K K K 为类别数, β k β_k βk 为第 k k k 类的权重, y n y_n yn 为第 n n n 个样本的 one-hot 标签, y ^ n \hat y_n y^n为第 n n n 个样本的预测概率。加权交叉熵对于缓解类不平衡问题很有用(Phan and Yamamoto 2020)。
Dice 损失(Dice Loss)
Dice 损失基于 Dice 系数,最初用于处理类别极度不均衡的问题(Milletari et al., 2016)。Dice 系数取值范围为 0-1,用于衡量预测结果与真实标签的相似度,其计算公式如下:
其中, y n y_n yn 和 y ^ n \hat y_n y^n分别为真实标签和预测值。
3.3.4 性能评估(Performance Assessment)
为了评估模型性能,我们计算 精确率(Precision)、召回率(Recall) 和 F1 值(F1 Score),其计算公式如下:
其中:
- TP(真阳性):正确分类为滑坡的像素数,
- TN(真阴性):正确分类为背景的像素数,
- FP(假阳性):真实背景像素被错误分类为滑坡的像素数,
- FN(假阴性):真实滑坡像素被错误分类为背景的像素数。
- 精确率(Precision):预测为滑坡的像素中,真正属于滑坡的比例。
- 召回率(Recall):真实滑坡像素中,被正确分类的比例。
- F1 值(F1 Score):精确率和召回率的调和平均值,在两者之间取得平衡。
下节请参考:【论文解读|滑坡检测·U-Net·语义分割· 深度学习·遥感·中分辨率影像】基于双编码器 U-Net 的滑坡检测方法:融合 Sentinel-2 影像与 DEM 数据(六)
欢迎铁子们点赞、关注、收藏!
祝大家逢考必过!逢投必中!上岸上岸上岸!upupup
大多数高校硕博生毕业要求需要参加学术会议,发表EI或者SCI检索的学术论文会议论文。详细信息可关注VX “
学术会议小灵通”或参考学术信息专栏:https://blog.csdn.net/2401_89898861/article/details/145551342
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐



所有评论(0)