[发明专利]一种基于边缘强化的显著性检测方法在审

专利信息
申请号: 202210620295.7 申请日: 2022-06-02
公开(公告)号: CN114898194A 公开(公告)日: 2022-08-12
发明(设计)人: 赵旭;王辉;陈恋;李智勇 申请(专利权)人: 湖南信控摩尔科技有限公司
主分类号: G06V10/82 分类号: G06V10/82;G06V10/26;G06N3/04;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 410083 湖南省长沙市岳麓区*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 边缘 强化 显著 检测 方法
【权利要求书】:

1.一种基于边缘强化的显著性检测方法,其特征在于包括以下步骤:

(1)获取数据集与检测标签:

获取显著性检测公开数据集及对应的检测标签;

(2)构建检测模型,该模型由特征提取器、解码器DE-1和DE-2、边缘强化模块ER-1和ER-2、整体注意力模块HA构成,具体构建过程包括以下步骤:

(2-a)构建特征提取器,以ResNet-50作为特征提取器的基础网络;所构建的特征提取器共分五层:第一层,即Res1,由单层卷积模块构成;第二层,即Res2,由一个池化层和三层残差模块构成;第三层,即Res3,由四层残差模块构成;第四层包括Res4-1和Res4-2,二者拥有相同的结构,都由六层残差模块构成,第五层包括Res5-1和Res5-2,二者也拥有相同的结构,都由三层残差模块构成;第四层和第五层为双分支结构,其中第四层的Res4-1和第五层的Res5-1串联构成第一个分支,第四层的Res4-2和第五层的Res5-2串联构成第二个分支;输入图像经过Res1处理,获得三维特征图f1_1、f1_2和f1_3,且f1_1=f1_2=f1_3;f1_3输入Res2获得三维特征图f2_1、f2_2和f2_3,且f2_1=f2_2=f2_3;f2_3输入Res3获得三维特征图f3_1、f3_2和f3_3,且f3_1=f3_2=f3_3;f3_3依次经过第一个分支的Res4-1和Res5-1处理后分别获得三维特征图f4_1和f5_1;f3_3与整体注意力模块HA的输出结果通过逐像素相乘实现加权,加权结果依次经过第二个分支的Res4-2和Res5-2处理后分别获得三维特征图f4_2和f5_2;HA由单层卷积构成,它以解码器DE-1的输出结果作为输入;

(2-b)构建解码器DE-n,该解码器由长依赖模块LRDM、感受野模块RFB、卷积上采样模块CU1、CU2、CU3,上采样模块Up和拼接层构成;将步骤(2-a)获取的三维特征图f2_n、f3_n、f4_n和f5_n分别作为解码器DE-n的输入1、输入2、输入3和输入4,n=1,2;fi_n依次经过LRDM与RFB处理后得到其中i=2,3,4,5;经过Up处理后,与一起输入到拼接层1,得到中间特征图经过CU1处理后,与一起输入到拼接层2,得到中间特征图经过CU2处理后,与一起输入到拼接层3,得到中间特征图经过CU3处理得到特征图map_n,即为解码器DE-n的输出结果;

该步骤中的长依赖模块LRDM构建如下:

以步骤(2-a)获得的特征图fi_n作为输入,经该模块的通道维度自适应均值池化层处理并进行特征展开后,获得一维特征,将一维特征输入全连接层后,经过激活函数与特征逆展开处理,再与特征图fi_n进行逐像素相乘操作,得到LRDM的输出;其中i=2,3,4,5,n=1,2;

(2-c)构建边缘强化模块ER-n,该模块由卷积块1和卷积块2构成,其中卷积块1由三层残差模块构成,卷积块2由五层卷积构成;将步骤(2-a)得到的特征图f1_n经卷积块1处理后,与步骤(2-b)得到的粗特征图mapn进行逐像素相加,再经卷积块2处理后,得到显著性检测图,其中n=1,2;

(3)构建损失函数:

构建如下混合损失函数Lmix

Lmix=LBCE+LMSSIM+LDice

其中LBCE为二元交叉熵损失,LMSSIM为平均结构相似性损失,LDice为Dice损失,分别定义如下:

其中P表示预测图,Gt表示标签图,二者尺寸相同,H表示图的高,W表示图的宽,Pi,j和Gti,j分别表示P和Gt中(i,j)点的像素值,且Pi,j∈(0,1),Gti,j为整数且Gti,j∈[0,1],log表示求自然对数,表示逐像素相加操作,表示逐像素相乘操作,C1与C2为实数常量,且C1、C2∈(0,0.1);M表示将标签图Gt以及对应的预测图P划分成子图对的个数,为预测图P第k个子图的均值,为标签图Gt第k个子图的均值,为预测图P第k个子图的方差,为标签图Gt第k个子图的方差,为预测图P的第k个子图和标签图Gt的第k个子图之间的协方差;|·|表示求取图像中所有像素的和;对模型的两个分支的显著性检测图分别计算混合损失函数,以这两个混合损失函数之和作为模型的总损失函数,定义如下:

Ltotal=Lmix-1+Lmix-2

其中,Lmix-1和Lmix-2分别表示第一和第二分支的显著性检测图与标签之间的混合损失,Ltotal表示模型的总损失函数;

(4)训练检测模型:

利用步骤(1)得到的数据集训练步骤(2)构建的检测模型,模型中的特征提取器使用预训练模型进行参数初始化;使用混合损失函数Lmix-1和Lmix-2分别衡量第一和第二分支的显著性检测图与标签之间的相似性;训练过程中使用Adam算法更新模型参数,并通过L-2正则化作为约束,直到损失值不再下降,得到训练好的显著性检测模型;

(5)推理并获得检测结果:

将测试图像经过归一化处理之后,输入至训练好的显著性检测模型,该模型第二分支得到的显著性检测图即为最终的显著性检测结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南信控摩尔科技有限公司,未经湖南信控摩尔科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210620295.7/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top