[发明专利]基于红通道和全卷积神经网络的水下光学智能感知方法有效
申请号: | 201810020550.8 | 申请日: | 2018-01-10 |
公开(公告)号: | CN108171672B | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 李学龙;王琦;李昊鹏 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06K9/32;G06K9/34;G06N3/04 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 常威威 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于红通道和全卷积神经网络的水下光学智能感知方法,利用光学信息对水下场景进行智能感知,首先通过选通成像设备采集得到对比度高且抑制“雾化”现象的水下光学图像,然后利用红通道算法对图像进行颜色恢复,有效地对图像进行视觉效果增强,使得图像更接近于自然光照下的成像效果,最后使用改进的全卷积神经网络对图像进行智能地语义分割,快速得到高精度的水下感知图像。 | ||
搜索关键词: | 图像 卷积神经网络 智能感知 红通道 成像设备 成像效果 光学图像 光学信息 视觉效果 水下场景 颜色恢复 语义分割 自然光照 有效地 雾化 选通 算法 感知 采集 智能 改进 | ||
【主权项】:
1.一种基于红通道和全卷积神经网络的水下光学智能感知方法,其特征在于包括以下步骤:步骤一:利用脉冲激光器和选通摄像机进行图像成像,得到水下场景图像,具体为:用脉冲激光源照明目标,接收端使用选通摄像机的距离选通门,使由场景中反射回来的辐射脉冲刚好在选通摄像机工作的时间内到达相机镜头并成像;步骤二:利用红通道算法对水下场景图像进行增强处理,得到增强后的水下场景图像,具体为:步骤a:通过红通道估计水色,首先,寻找满足下述条件的像素p0:
其中
为步骤一得到的水下场景图像I的红通道,IR、IG、IB分别表示图像I的RGB三个分量,Ω(p)表示像素p的5×5邻域,y表示任意属于Ω(p)的一个像素;然后,以A=I(p0)=(AR,AG,AB)作为水色估计值,其中,AR、AG、AB分别表示水色A的RGB三个颜色分量;步骤b:衰减率估计,分别利用以下公式计算得到每个像素的RGB三个颜色的衰减率估计值tR(p)、tG(p)和tB(p):
其中,d(p)表示像素p所代表的真实目标与摄像机之间的距离,β=(βR,βG,βB)为固有衰减系数;步骤c:通过红通道进行颜色校正,得到增强后的水下图像J=(JR,JG,JB),即分别按照以下公式计算得到每个像素的RGB三个颜色的校正值JR(p)、JG(p)和JB(p):
其中,t0为正则因子,取值范围为[0.05,0.2];步骤三:利用改进的全卷积神经网络对增强后的水下场景图像进行语义分割,得到水下光学感知图像,具体为:步骤a:数据标注,拍摄各种水下场景图像,对其进行如步骤二所述的增强处理,然后进行像素级别的人工标注,标注每个像素所属类别,得到标注后图像;步骤b:网络训练,以任意80%标注后图像为训练集,输入改进的全卷积神经网络进行训练,其中,学习率设置为0.01,动量设置为0.9,并利用随机梯度下降法进行参数更新,得到训练后的神经网络, 并计算网络在训练集上的精度,计算公式为
其中,OA表示分类精度,Nc表示分类正确的像素个数,N表示像素总个数;所述的改进的全卷积神经网络结构共包括13层,第一层为卷积层,卷积核数目为96,大小为11×11,padding设置为5,并用ReLU激活;第二层为池化层,池化核大小设置为4×4;第三层为卷积层,卷积核数目为256,大小为5×5,padding设置为2,并用ReLU激活;第四层为池化层,池化核大小设置为2×2;第五层为卷积层,卷积核数目为384,大小为3×3,padding为设置为1,并用ReLU激活;第六层为池化层,池化核大小设置为2×2;第七层为卷积层,卷积核数目为384,大小为3×3,padding设置为1,并用ReLU激活;第八层为卷积层,卷积核数目为256,大小为3×3,padding设置为1,并用ReLU激活;第九层为卷积层,卷积核数目为2048,大小为1×1,并用ReLU激活;第十层为池化层,池化核大小设置为2×2;第十一层为卷积层,卷积核数目为2048,大小为1×1,并用ReLU激活;第十二层为卷积层,卷积核数目为50,大小为1×1,并用ReLU激活;第十三层为上采样层,上采样核大小为32×32;步骤c:网络测试,利用剩余20%标注图像对步骤b训练好的神经网络进行分类测试,并按
计算得到当前状态下模型的像素分类精度,其中,OA表示分类精度,Nc表示分类正确的像素个数,N表示像素总个数;步骤d:网络优化,根据步骤c的测试结果对网络学习率和正则参数进行调整,具体为:若在训练集上精度低于90%,表示没有收敛到局部最优解,学习率降低10倍;若模型在训练集上的精度远高于测试集20%,表示模型训练过拟合,正则参数增大10倍;步骤e:重复步骤b‑d,直至测试集的分类精度不再改变,得到最优网络模型;步骤f:利用最优网络模型对步骤二增强后的水下图像进行语义分割,得到水下光学感知图像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810020550.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种放大眼睛的美型方法及装置
- 下一篇:针对任意视角投影仪图像的视觉矫正方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序