[发明专利]一种基于深度卷积神经网络的沥青路面裂缝图像分割方法有效
| 申请号: | 202110012193.2 | 申请日: | 2021-01-06 |
| 公开(公告)号: | CN112634292B | 公开(公告)日: | 2021-08-24 |
| 发明(设计)人: | 万海峰;李娜;孙启润;黄磊;苑兆迪 | 申请(专利权)人: | 烟台大学 |
| 主分类号: | G06T7/11 | 分类号: | G06T7/11;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 山东三邦知识产权代理事务所(普通合伙) 37308 | 代理人: | 肖太升;高洋 |
| 地址: | 264005 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 卷积 神经网络 沥青路面 裂缝 图像 分割 方法 | ||
1.一种基于深度卷积神经网络的沥青路面裂缝图像分割方法,其特征在于,包括以下步骤:
步骤一:准备沥青路面裂缝图片数据集;
步骤二:图片预处理;图片的预处理包括对大的图像进行缩放到统一的尺寸;
步骤三:设定CrackResAttentionNet的模型结构;CrackResAttentionNet的模型采用基于编码器-解码器的结构,包括编码器和解码器,在每个编码器和解码器之间,增加一个注意力模块,所述注意力模块位于每个编码器后并与相应的解码器相连;
所述编码器由输入层、编码层-1至编码层-5组成,其中编码层-1至编码层-4分别对应经过预备训练的ResNet34网络的第一层至第四层,分别为ResNet34-1至ResNet34-4;解码器由解码层-1至解码层-5、输出层组成;
步骤四:确定损失函数;使用像素交叉熵损失(CE)、平衡像素交叉熵损失(BCE)以及Dice损失进行比较:
步骤401:像素交叉熵损失CE如下公式(6)所示:
上述i表示像素的索引,n*n表示输出图像的大小,pi为样本的真实值,正类为1,负类为0,为样本预测为正的概率;
步骤402:平衡像素交叉熵损失与像素交叉熵损失类似,权重之和为1,如下公式(7)所示:
其中,BCE为平衡像素交叉熵损失,n*n表示输出像素的大小,β为平衡系数,pi为样本的真实值,正类为1,负类为0,为样本预测为正的概率;
步骤403:Dice损失从交并比IoU的角度设计,Dice损失如公式(8)所示:
公式(8)中,TP为像素真阳性,FN为像素假阴性;
步骤五:确定优化器,采用Adam优化器;
步骤六:初始化权值矩阵;对于ResNet34预训练模型部分,使用预训练模型的权值,对于除ResNet34以外的其它层包括输入层、输出层、编码层5、解码层1至解码层5,使用正态分布初始化权值矩阵;
步骤七:前向传播;输入信号在权值矩阵的帮助下,得到每一层的输出,最终到达输出层的预测值;
步骤八:反向传播;当通过前向传播得到由任意一组随机参数计算出的网络预测结果后,利用损失函数相对于每个参数的梯度进行修正更新;
步骤九:更新权值矩阵;根据反向传播得到的参数的梯度来对权值矩阵进行更新;
步骤十:如果没有到达最大训练次数,则返回步骤七,继续前向传播,否则就保存性能最好的CrackResAttentionNet二进制模型;
步骤十一:输入待分割的沥青路面裂缝图像;将拍摄的沥青路面裂缝图像搜集后,作为系统的输入;
步骤十二:图像预处理;图片的预处理包括对大的图像进行缩放到统一的尺寸;
步骤十三:加载训练好的CrackResAttentionNet,其步骤为:
步骤1301:根据传入的文件名称,找到训练好的模型文件;
步骤1302:读取模型文件到内存;
步骤1303:预测模型使用加载的模型文件里的参数进行预测;
步骤十四:裂缝图像分割输出;输入带裂缝的沥青路面图像,通过训练好的CrackResAttentionNet,预测出分割好的沥青路面图像,其中裂缝的像素以白色显示,其他背景则以黑色显示;
步骤十五:获取训练好的CrackResAttentionNet模型文件保存在磁盘上,同时加载模型二进制文件到内存。
2.如权利要求1所述的方法,其特征在于,所述步骤一中,具体采用步骤101或步骤102的方案:
步骤101:直接使用已经标注的公开的裂缝分割数据集,该数据集包含沥青路面裂缝图像以及已经标注的裂缝形状和位置,作为裂缝图片数据集;
步骤102:拍摄真实的沥青路面裂缝照片,组成裂缝图片数据集;通过Labelme软件手动给每张裂缝照片标注裂缝形状和位置;
步骤102,手动标注采用以下4个分步骤予以实现:
步骤1021,启动Labelme软件窗口,打开一张沥青路面裂缝照片;
步骤1022,根据裂缝的形状,用鼠标在裂缝的外轮廓画出多边形,使得多边形刚好覆盖了裂缝;
步骤1023,给裂缝命名为crack标记,并保存该图像文件;
步骤1024,Labelme会自动生成一个json文件,包含了多边形的各个坐标点位置和标记。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烟台大学,未经烟台大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110012193.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带有桥梁空心板连接装置的桥梁及其施工方法
- 下一篇:一种新型防抖振镜机构





