[发明专利]基于深度卷积神经网络的图像裂缝分割方法在审
申请号: | 201710267789.0 | 申请日: | 2017-04-21 |
公开(公告)号: | CN107133960A | 公开(公告)日: | 2017-09-05 |
发明(设计)人: | 姚剑;刘亚辉;赵娇;谢仁平 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06T7/13 | 分类号: | G06T7/13;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙)42222 | 代理人: | 胡艳 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 卷积 神经网络 图像 裂缝 分割 方法 | ||
1.基于深度卷积神经网络的图像裂缝分割方法,其特征是:
所采用的深度卷积神经网络包括5个卷积阶段,其中,第一个卷积阶段包括卷积层Conv1_1和卷积层Conv1_2,卷积层Conv1_1和卷积层Conv1_2分别使用64个卷积核;第二个卷积阶段包括卷积层Conv2_1和卷积层Conv2_2,卷积层Conv2_1和卷积层Conv2_2分别使用128个卷积核;第三个卷积阶段包括卷积层Conv3_1、卷积层Conv3_2和卷积层Conv3_3,卷积层Conv3_1、卷积层Conv3_2和卷积层Conv3_3分别使用256个卷积核;第四个卷积阶段包括卷积层conv4_1、卷积层conv4_2和卷积层conv4_3,卷积层conv4_1、卷积层Conv4_2和卷积层Conv4_3分别使用512个卷积核;第五个卷积阶段包括卷积层Conv5_1、卷积层Conv5_2和卷积层Conv5_3,卷积层conv5_1、卷积层conv5_2和卷积层conv5_3分别使用512个卷积核;卷积层conv1_2、卷积层conv2_2、卷积层conv3_3和卷积层conv4_3后均依次紧跟批标准化层、非线性激活层、池化层;其他卷积层后均依次紧跟批标准化层、非线性激活层;
将卷积层conv1_1后紧跟的批标准化层、非线性激活层记为第一批标准化层、第一非线性激活层;将卷积层conv1_2后紧跟的批标准化层、非线性激活层、池化层记为第二批标准化层、第二非线性激活层、第一池化层;
将卷积层conv2_1后紧跟的批标准化层、非线性激活层记为第三批标准化层、第三非线性激活层;将卷积层conv2_2后紧跟的批标准化层、非线性激活层、池化层记为第四批标准化层、第四非线性激活层、第二池化层;
将卷积层conv3_1后紧跟的批标准化层、非线性激活层记为第五批标准化层、第五非线性激活层;将卷积层conv3_2后紧跟的批标准化层、非线性激活层记为第六批标准化层、第六非线性激活层;将卷积层conv3_3后紧跟的批标准化层、非线性激活层、池化层记为第七批标准化层、第七非线性激活层、第三池化层;
将卷积层conv4_1后紧跟的批标准化层、非线性激活层记为第八批标准化层、第八非线性激活层;将卷积层conv4_2后紧跟的批标准化层、非线性激活层记为第九批标准化层、第九非线性激活层;将卷积层conv4_3后紧跟的批标准化层、非线性激活层、池化层记为第十批标准化层、第十非线性激活层、第四池化层;
将卷积层conv5_1后紧跟的批标准化层、非线性激活层记为第十一批标准化层、第十一非线性激活层;将卷积层conv5_2后紧跟的批标准化层、非线性激活层记为第十二批标准化层、第十二非线性激活层;将卷积层conv5_3后紧跟的批标准化层、非线性激活层、池化层记为第十三批标准化层、第十三非线性激活层;
原始图像从卷积层conv1_1输入;第一个卷积阶段中,原始图像顺次经卷积层conv1_1、第一批标准化层、第一非线性激活层、卷积层conv1_2、第二批标准化层、第二非线性激活层输出第一特征图;第一特征图经第一池化层后输入第二个卷积阶段,顺次经卷积层conv2_1、第三批标准化层、第三非线性激活层、卷积层conv2_2、第四批标准化层、第四非线性激活层输出第二特征图;第二特征图经第二池化层后输入第三个卷积阶段,顺次经卷积层conv3_1、第五批标准化层、第五非线性激活层、卷积层conv3_2、第六批标准化层、第六非线性激活层、卷积层conv3_3、第七批标准化层、第七非线性激活层输出第三特征图;第三特征图经第三池化层后输入第四个卷积阶段,顺次经卷积层conv4_1、第八批标准化层、第八非线性激活层、卷积层conv4_2、第九批标准化层、第九非线性激活层、卷积层conv4_3、第十批标准化层、第十非线性激活层输出第四特征图;第四特征图经第四池化层后输入第四个卷积阶段,顺次经卷积层conv5_1、第十一批标准化层、第十一非线性激活层、卷积层conv5_2、第十二批标准化层、第十二非线性激活层、卷积层conv5_3、第十三批标准化层、第十三非线性激活层输出第五特征图;
对第一特征图、第二特征图、第三特征图、第四特征图、第五特征图分别经过卷积层Conv1、卷积层Conv2、卷积层Conv3、卷积层Conv4、卷积层Conv5,Conv1、卷积层Conv2、卷积层Conv3、卷积层Conv4、卷积层Conv5的输出特征图分别经去卷积层Deconv2、Deconv3、Deconv4、Deconv5依次进行去卷积、上采样,获得与原始图像大小相同的特征图;将五个与原始图像大小相同的特征图通过连接层融合,连接层的输出依次通过卷积层Conv-1-2降维、通过softmax函数获得各像素对应的裂缝和非裂缝的预测概率,记为融合预测概率,从而实现原始图像的图像裂缝分割;
将第二非线性激活层、去卷积层Deconv2、Deconv3、Deconv4、Deconv5的输出记为侧边输出;
所述的深度卷积神经网络采用如下方法进行训练:
采集训练样本集将训练样本集输入深度卷积神经网络,其中,Ir表示第r张训练样本,Gr为Ir对应的人工标注,统计各训练样本中非裂缝像素和裂缝像素的数量,分别记为C0和C1;
以损失代价值最小作为目标优化深度卷积神经网络的参数,所述的损失代价函数为:
L(I,G,W)=Lside(I,G,W,w)+Lfuse(I,G,W)
其中:
Lside(I,G,W,w)表示侧边损失代价,
ω0和ω1是类平衡权值,ω0=1,ω1=C0/C1;
I(k)和G(k)是分别指I和G的第k个像素对应的值,logPr(*)指softmax函数;
Lfuse(I,G,Q)表示融合损失代价,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710267789.0/1.html,转载请声明来源钻瓜专利网。