[发明专利]一种基于深度卷积神经网络的沥青路面裂缝图像分割方法有效

专利信息
申请号: 202110012193.2 申请日: 2021-01-06
公开(公告)号: CN112634292B 公开(公告)日: 2021-08-24
发明(设计)人: 万海峰;李娜;孙启润;黄磊;苑兆迪 申请(专利权)人: 烟台大学
主分类号: G06T7/11 分类号: G06T7/11;G06K9/62;G06N3/04;G06N3/08
代理公司: 山东三邦知识产权代理事务所(普通合伙) 37308 代理人: 肖太升;高洋
地址: 264005 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 卷积 神经网络 沥青路面 裂缝 图像 分割 方法
【权利要求书】:

1.一种基于深度卷积神经网络的沥青路面裂缝图像分割方法,其特征在于,包括以下步骤:

步骤一:准备沥青路面裂缝图片数据集;

步骤二:图片预处理;图片的预处理包括对大的图像进行缩放到统一的尺寸;

步骤三:设定CrackResAttentionNet的模型结构;CrackResAttentionNet的模型采用基于编码器-解码器的结构,包括编码器和解码器,在每个编码器和解码器之间,增加一个注意力模块,所述注意力模块位于每个编码器后并与相应的解码器相连;

所述编码器由输入层、编码层-1至编码层-5组成,其中编码层-1至编码层-4分别对应经过预备训练的ResNet34网络的第一层至第四层,分别为ResNet34-1至ResNet34-4;解码器由解码层-1至解码层-5、输出层组成;

步骤四:确定损失函数;使用像素交叉熵损失(CE)、平衡像素交叉熵损失(BCE)以及Dice损失进行比较:

步骤401:像素交叉熵损失CE如下公式(6)所示:

上述i表示像素的索引,n*n表示输出图像的大小,pi为样本的真实值,正类为1,负类为0,为样本预测为正的概率;

步骤402:平衡像素交叉熵损失与像素交叉熵损失类似,权重之和为1,如下公式(7)所示:

其中,BCE为平衡像素交叉熵损失,n*n表示输出像素的大小,β为平衡系数,pi为样本的真实值,正类为1,负类为0,为样本预测为正的概率;

步骤403:Dice损失从交并比IoU的角度设计,Dice损失如公式(8)所示:

公式(8)中,TP为像素真阳性,FN为像素假阴性;

步骤五:确定优化器,采用Adam优化器;

步骤六:初始化权值矩阵;对于ResNet34预训练模型部分,使用预训练模型的权值,对于除ResNet34以外的其它层包括输入层、输出层、编码层5、解码层1至解码层5,使用正态分布初始化权值矩阵;

步骤七:前向传播;输入信号在权值矩阵的帮助下,得到每一层的输出,最终到达输出层的预测值;

步骤八:反向传播;当通过前向传播得到由任意一组随机参数计算出的网络预测结果后,利用损失函数相对于每个参数的梯度进行修正更新;

步骤九:更新权值矩阵;根据反向传播得到的参数的梯度来对权值矩阵进行更新;

步骤十:如果没有到达最大训练次数,则返回步骤七,继续前向传播,否则就保存性能最好的CrackResAttentionNet二进制模型;

步骤十一:输入待分割的沥青路面裂缝图像;将拍摄的沥青路面裂缝图像搜集后,作为系统的输入;

步骤十二:图像预处理;图片的预处理包括对大的图像进行缩放到统一的尺寸;

步骤十三:加载训练好的CrackResAttentionNet,其步骤为:

步骤1301:根据传入的文件名称,找到训练好的模型文件;

步骤1302:读取模型文件到内存;

步骤1303:预测模型使用加载的模型文件里的参数进行预测;

步骤十四:裂缝图像分割输出;输入带裂缝的沥青路面图像,通过训练好的CrackResAttentionNet,预测出分割好的沥青路面图像,其中裂缝的像素以白色显示,其他背景则以黑色显示;

步骤十五:获取训练好的CrackResAttentionNet模型文件保存在磁盘上,同时加载模型二进制文件到内存。

2.如权利要求1所述的方法,其特征在于,所述步骤一中,具体采用步骤101或步骤102的方案:

步骤101:直接使用已经标注的公开的裂缝分割数据集,该数据集包含沥青路面裂缝图像以及已经标注的裂缝形状和位置,作为裂缝图片数据集;

步骤102:拍摄真实的沥青路面裂缝照片,组成裂缝图片数据集;通过Labelme软件手动给每张裂缝照片标注裂缝形状和位置;

步骤102,手动标注采用以下4个分步骤予以实现:

步骤1021,启动Labelme软件窗口,打开一张沥青路面裂缝照片;

步骤1022,根据裂缝的形状,用鼠标在裂缝的外轮廓画出多边形,使得多边形刚好覆盖了裂缝;

步骤1023,给裂缝命名为crack标记,并保存该图像文件;

步骤1024,Labelme会自动生成一个json文件,包含了多边形的各个坐标点位置和标记。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烟台大学,未经烟台大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110012193.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top