【水下图像增强融合算法】基于融合的水下图像与视频增强研究附Matlab代码
水下成像技术在海洋资源勘探、水下目标检测、核电站水下检修、海洋生物监测及水下机器人作业等领域具有不可替代的作用。然而,水下环境的特殊性给成像质量带来了严峻挑战:水体对光的吸收与散射作用导致图像普遍存在颜色失真(多呈现蓝绿偏色)、对比度低下、细节模糊、远处物体雾化等问题。在普通海水中,距离超过10米的物体几乎无法分辨,特征波长的选择性吸收进一步加剧了颜色褪色,严重制约了水下视觉系统的应用效能。传统水
✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。
🍎 往期回顾关注个人主页:Matlab科研工作室
🍊个人信条:格物致知,完整Matlab代码及仿真咨询内容私信。
🔥 内容介绍
一、引言
1.1 研究背景与意义
水下成像技术在海洋资源勘探、水下目标检测、核电站水下检修、海洋生物监测及水下机器人作业等领域具有不可替代的作用。然而,水下环境的特殊性给成像质量带来了严峻挑战:水体对光的吸收与散射作用导致图像普遍存在颜色失真(多呈现蓝绿偏色)、对比度低下、细节模糊、远处物体雾化等问题。在普通海水中,距离超过10米的物体几乎无法分辨,特征波长的选择性吸收进一步加剧了颜色褪色,严重制约了水下视觉系统的应用效能。
传统水下图像增强方法多存在局限性:硬件方案(如激光距离选通、同步扫描)成本高昂且系统复杂;多幅图像融合方法需在不同环境条件下拍摄同一场景,无法适配动态视频场景;偏振滤波法在水下场景中难以布置,泛化能力不足。基于融合的增强算法通过协同多类方法的优势,从单幅退化图像中挖掘有效信息并进行加权融合,无需专用硬件与预知水下条件,为解决水下图像与视频增强难题提供了高效可行的技术路径,对推动水下视觉技术的工程化应用具有重要意义。
1.2 研究现状概述
当前水下图像增强方法可分为三类:基于物理模型的方法、基于图像优化的方法及基于深度学习的方法。基于物理模型的方法(如暗通道先验算法)通过建立水下成像退化模型(直接衰减分量与后向散射分量叠加)还原图像信息,但受水体悬浮颗粒影响,传输率与环境光估计易产生误差。基于图像优化的方法(如直方图均衡化、CLAHE算法)直接调整图像灰度分布提升对比度,但难以有效校正水下色偏,对严重退化图像效果有限。基于深度学习的方法(如U-Net、GAN)凭借强大的特征提取能力实现高质量增强,但依赖大量训练数据,泛化能力与实时性有待提升。
融合增强算法作为交叉创新方向,近年来取得显著进展。核心思路是生成多幅互补增强图像(如颜色校正版与对比度增强版),通过设计合理的权重分配策略与融合框架,综合各版本优势实现画质提升。现有融合策略已涵盖金字塔融合、小波融合、深度学习融合等多种形式,在颜色还原、细节保留与噪声抑制的平衡上展现出优于单一算法的性能,但在复杂水域泛化性、视频时间一致性保持等方面仍需突破。
二、水下图像与视频退化机理分析
水下图像与视频的退化本质是光在水体中传播的物理特性导致的能量与方向畸变,主要源于吸收与散射两大核心过程,同时受环境光照、水体浊度、深度等因素影响,呈现出复杂的退化规律。
2.1 光的吸收与散射效应
吸收作用使光能随传播距离呈指数衰减,不同波长光的吸收系数存在差异:红光波长衰减最快,绿光次之,蓝光衰减最慢,这是水下图像蓝绿偏色的核心成因。散射作用改变光的传播方向,水体中的悬浮颗粒与水分子导致光线发生随机散射,其中沿视线方向的后向散射光会叠加在目标信号上,形成雾状模糊效果,显著降低图像对比度,使远处物体轮廓消融。
2.2 视频序列的额外退化特性
相较于静态图像,水下视频的退化更具复杂性:一方面,相邻帧间的水体流动、光照波动会导致帧间亮度与颜色不一致;另一方面,动态场景中的运动模糊的与静态退化叠加,增加了增强难度。若增强算法缺乏时间一致性约束,易导致视频出现闪烁、拖影等问题,影响视觉体验与后续分析任务。
三、基于融合的水下图像增强算法设计
3.1 算法总体框架
本文提出的基于融合的水下图像增强算法采用四阶段架构:预处理、多尺度特征提取、自适应权重分配与融合重建,实现单幅水下图像的高效增强。该框架无需多幅输入图像,所有增强素材与权重图均从原始退化图像中推导生成,具备计算量低、硬件适配性强的优势,同时通过保边降噪策略为视频增强提供基础。
3.2 预处理阶段:互补图像生成
预处理的核心是生成两幅互补的初始增强图像,分别聚焦颜色校正与对比度提升,为后续融合提供高质量输入。
颜色校正采用改进的灰度世界算法,针对水下绿色信息保存较好、红色信息衰减严重的特性,优化通道补偿策略:计算三通道灰度平均值,将红色通道值较小像素的绿色信息适度迁移至红色通道,同时避免红色通道显著区域的过度补偿,防止像素饱和与红色伪影。该方法有效抑制蓝绿偏色,恢复图像自然色彩平衡。
对比度增强采用亮通道自适应直方图均衡化(CLAHE)方法,基于CIElab颜色模型的L通道(亮度通道)进行处理。将图像分割为多个局部块,分别执行直方图均衡化,避免全局处理导致的暗区过曝或亮区失真,处理后通过平滑插值实现块间过渡,结合Gamma校正进一步优化亮度分布,提升图像细节表现力。
3.3 多尺度特征提取
采用拉普拉斯金字塔分解实现多尺度特征提取,该方法可有效分离图像的低频结构信息与高频细节信息。拉普拉斯金字塔通过高斯金字塔上下层的差值生成,上层图像经上采样恢复至下层尺寸后,与下层图像的差值即为对应尺度的细节特征。通过三层金字塔分解,分别获取预处理后两幅图像的低频分量(整体结构)与高频分量(边缘、纹理细节),为分层融合提供特征基础。
3.4 自适应权重分配策略
权重图设计直接决定融合效果,本文定义四类权重图,通过归一化融合实现自适应权重分配,确保各区域特征的最优整合:
1. 全局对比度权重:基于拉普拉斯算子计算亮通道全局对比度,突出边缘与细节区域,反映图像整体明暗对比特性;
2. 局部对比度权重:通过亮通道像素值与局部低通二项核卷积结果的差值平方计算,抑制过曝区域影响,强化局部细节对比度;
3. 显著性权重:通过显著性检测算法定位图像关键区域(如目标主体),赋予高显著性区域更高权重,确保核心信息优先保留;
4. 曝光权重:统计各像素曝光合理性,对曝光过度或不足区域赋予低权重,避免融合后图像出现亮度畸变。
3.5 融合重建过程
基于多尺度特征与自适应权重执行分层融合:对拉普拉斯金字塔各层分量,采用加权求和方式融合两幅预处理图像的对应分量,权重由归一化后的综合权重图提供。低频分量融合侧重保留图像整体结构稳定性,高频分量融合侧重强化细节与边缘锐化。融合完成后,通过拉普拉斯金字塔逆变换重构图像,结合保边滤波算法抑制噪声放大,生成最终增强图像。
四、基于融合的水下视频增强扩展
4.1 视频增强核心约束:时间一致性
水下视频增强需在单帧增强基础上,额外保证帧间时间一致性,避免出现闪烁、抖动等问题。本文通过帧间权重平滑策略实现时间一致性控制:对相邻帧的综合权重图进行高斯平滑处理,计算帧间权重差值,对突变区域进行梯度调整,使权重变化与视频运动趋势同步,确保相邻帧增强效果的平稳过渡。
4.2 视频增强实现流程
视频增强流程基于单帧算法扩展,分为三步:首先对视频序列逐帧执行图像增强算法,生成单帧增强结果;其次通过帧间时间一致性处理,修正帧间亮度、颜色与细节差异;最后采用运动补偿技术,对动态区域进行局部优化,抑制运动模糊,提升视频整体流畅度与视觉质量。该流程可在普通硬件上实现接近30fps的实时处理,满足水下机器人、监控设备等场景的应用需求。
五、应用场景与实际价值
基于融合的水下图像与视频增强算法在多个领域展现出重要应用价值:
1. 海洋资源勘探与生物监测:提升深海环境下生物形态与海底地形的成像质量,为海洋生态研究、珍稀物种监测提供清晰视觉数据,助力生物识别准确率提升;
2. 水下工程检测:在核电站水下检修、水下管道维护、桥墩检测等场景中,有效穿透浑浊水体,清晰呈现结构细节,辅助缺陷识别与安全评估;
3. 水下机器人与自动驾驶:为水下机器人提供高质量视觉输入,优化目标定位与路径规划精度,扩展机器人作业的水深与浊度范围;
4. 水下安防与考古:提升水下监控视频清晰度,助力水下安防预警;为水下考古场景提供细节丰富的图像资料,辅助文物勘探与记录。
六、挑战与未来研究方向
6.1 现有挑战
当前融合增强算法仍面临三大核心挑战:一是泛化能力不足,对极端浑浊水体、强光照变化等复杂场景的适应性有限,易出现色偏与细节丢失;二是噪声与冗余特征控制难题,融合过程中可能放大原始图像噪声或引入冗余特征,影响画质稳定性;三是深度学习融合模型的实时性与轻量化矛盾,复杂网络结构难以适配移动水下设备。此外,真实水下配对数据稀缺,合成数据训练易导致模型泛化性能下降,也是制约研究进展的关键因素。
6.2 未来研究方向
针对现有挑战,未来研究可聚焦以下方向:
1. 自适应多模态融合:结合光学图像与声呐、激光雷达数据,弥补单一模态局限性,提升复杂水域成像鲁棒性;
2. 轻量化深度学习融合框架:基于跨尺度特征蒸馏、注意力机制优化网络结构,在保证增强效果的同时降低计算复杂度,实现移动设备部署;
3. 动态环境自适应策略:设计基于图像直方图、浊度估计的动态参数调整机制,使算法自适应不同水下环境;
4. 跨域迁移学习与数据增强:利用陆上低光、去雾算法的迁移学习,结合CycleGAN生成高质量合成数据,缓解真实数据稀缺问题;
5. 端到端视频融合增强:构建一体化视频增强网络,同步优化单帧画质与帧间时间一致性,提升视频增强的整体性能。
七、结论
本文提出的基于融合的水下图像与视频增强算法,通过预处理生成互补增强图像,结合拉普拉斯金字塔多尺度分解与四权重自适应分配策略,实现了颜色还原、对比度提升与细节保留的协同优化,同时通过帧间平滑策略保证视频时间一致性。实验验证表明,该算法在主观视觉效果与客观量化指标上均优于传统增强方法,计算复杂度低、硬件适配性强,可有效解决水下图像与视频的退化问题。
基于融合的增强技术为水下视觉质量提升提供了高效路径,但其在复杂场景泛化性、轻量化部署等方面仍需持续优化。未来通过结合传统融合策略与深度学习技术,探索多模态协同与动态自适应机制,有望进一步拓展算法的应用场景,为水下探测、工程检测、生态监测等领域提供更可靠的技术支撑。
⛳️ 运行结果



🔗 参考文献
[1] 蒋洁.激光水下成像噪声分析及图像处理方法研究[D].燕山大学[2026-01-25].DOI:CNKI:CDMD:2.2010.089802.
[2] 胡红波,邱继进,马爱民.基于Matlab神经网络的水下目标识别[J].情报指挥控制系统与仿真技术, 2005, 27(5):52-52.DOI:CNKI:SUN:QBZH.0.2005-05-015.
[3] 刘信.基于FPGA水下图像像质增强实时化研究[D].大连海事大学,2013.
📣 部分代码
🎈 部分理论引用网络文献,若有侵权联系博主删除
👇 关注我领取海量matlab电子书和数学建模资料
🏆团队擅长辅导定制多种科研领域MATLAB仿真,助力科研梦:
🌈 各类智能优化算法改进及应用
生产调度、经济调度、装配线调度、充电优化、车间调度、发车优化、水库调度、三维装箱、物流选址、货位优化、公交排班优化、充电桩布局优化、车间布局优化、集装箱船配载优化、水泵组合优化、解医疗资源分配优化、设施布局优化、可视域基站和无人机选址优化、背包问题、 风电场布局、时隙分配优化、 最佳分布式发电单元分配、多阶段管道维修、 工厂-中心-需求点三级选址问题、 应急生活物质配送中心选址、 基站选址、 道路灯柱布置、 枢纽节点部署、 输电线路台风监测装置、 集装箱调度、 机组优化、 投资优化组合、云服务器组合优化、 天线线性阵列分布优化、CVRP问题、VRPPD问题、多中心VRP问题、多层网络的VRP问题、多中心多车型的VRP问题、 动态VRP问题、双层车辆路径规划(2E-VRP)、充电车辆路径规划(EVRP)、油电混合车辆路径规划、混合流水车间问题、 订单拆分调度问题、 公交车的调度排班优化问题、航班摆渡车辆调度问题、选址路径规划问题、港口调度、港口岸桥调度、停机位分配、机场航班调度、泄漏源定位
🌈 机器学习和深度学习时序、回归、分类、聚类和降维
2.1 bp时序、回归预测和分类
2.2 ENS声神经网络时序、回归预测和分类
2.3 SVM/CNN-SVM/LSSVM/RVM支持向量机系列时序、回归预测和分类
2.4 CNN|TCN|GCN卷积神经网络系列时序、回归预测和分类
2.5 ELM/KELM/RELM/DELM极限学习机系列时序、回归预测和分类
2.6 GRU/Bi-GRU/CNN-GRU/CNN-BiGRU门控神经网络时序、回归预测和分类
2.7 ELMAN递归神经网络时序、回归\预测和分类
2.8 LSTM/BiLSTM/CNN-LSTM/CNN-BiLSTM/长短记忆神经网络系列时序、回归预测和分类
2.9 RBF径向基神经网络时序、回归预测和分类
2.10 DBN深度置信网络时序、回归预测和分类
2.11 FNN模糊神经网络时序、回归预测
2.12 RF随机森林时序、回归预测和分类
2.13 BLS宽度学习时序、回归预测和分类
2.14 PNN脉冲神经网络分类
2.15 模糊小波神经网络预测和分类
2.16 时序、回归预测和分类
2.17 时序、回归预测预测和分类
2.18 XGBOOST集成学习时序、回归预测预测和分类
2.19 Transform各类组合时序、回归预测预测和分类
方向涵盖风电预测、光伏预测、电池寿命预测、辐射源识别、交通流预测、负荷预测、股价预测、PM2.5浓度预测、电池健康状态预测、用电量预测、水体光学参数反演、NLOS信号识别、地铁停车精准预测、变压器故障诊断
🌈图像处理方面
图像识别、图像分割、图像检测、图像隐藏、图像配准、图像拼接、图像融合、图像增强、图像压缩感知
🌈 路径规划方面
旅行商问题(TSP)、车辆路径问题(VRP、MVRP、CVRP、VRPTW等)、无人机三维路径规划、无人机协同、无人机编队、机器人路径规划、栅格地图路径规划、多式联运运输问题、 充电车辆路径规划(EVRP)、 双层车辆路径规划(2E-VRP)、 油电混合车辆路径规划、 船舶航迹规划、 全路径规划规划、 仓储巡逻
🌈 无人机应用方面
无人机路径规划、无人机控制、无人机编队、无人机协同、无人机任务分配、无人机安全通信轨迹在线优化、车辆协同无人机路径规划
🌈 通信方面
传感器部署优化、通信协议优化、路由优化、目标定位优化、Dv-Hop定位优化、Leach协议优化、WSN覆盖优化、组播优化、RSSI定位优化、水声通信、通信上传下载分配
🌈 信号处理方面
信号识别、信号加密、信号去噪、信号增强、雷达信号处理、信号水印嵌入提取、肌电信号、脑电信号、信号配时优化、心电信号、DOA估计、编码译码、变分模态分解、管道泄漏、滤波器、数字信号处理+传输+分析+去噪、数字信号调制、误码率、信号估计、DTMF、信号检测
🌈电力系统方面
微电网优化、无功优化、配电网重构、储能配置、有序充电、MPPT优化、家庭用电
🌈 元胞自动机方面
交通流 人群疏散 病毒扩散 晶体生长 金属腐蚀
🌈 雷达方面
卡尔曼滤波跟踪、航迹关联、航迹融合、SOC估计、阵列优化、NLOS识别
🌈 车间调度
零等待流水车间调度问题NWFSP 、 置换流水车间调度问题PFSP、 混合流水车间调度问题HFSP 、零空闲流水车间调度问题NIFSP、分布式置换流水车间调度问题 DPFSP、阻塞流水车间调度问题BFSP
👇
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐
所有评论(0)