[发明专利]一种基于注意力机制的显著物体检测方法有效
申请号: | 201810828215.0 | 申请日: | 2018-07-25 |
公开(公告)号: | CN108960261B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 周思远;周平;陈舒涵;钱甦阳;黄华杰;胡学龙 | 申请(专利权)人: | 扬州万方电子技术有限责任公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
代理公司: | 扬州市苏为知识产权代理事务所(普通合伙) 32283 | 代理人: | 周全;葛军 |
地址: | 225006*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于注意力机制的显著物体检测方法。涉及计算机视觉与数字图像处理领域,具体涉及一种基于注意力机制的显著物体检测方法。提供了一种基于注意力机制的显著物体检测方法,首先设计自顶向下的注意力网络用于提纯各层卷积特征,然后引入二阶项设计残差特征融合网络以更好地保留残差特征;实现以任意的静态彩色图像为输入,其输出是与输入图像大小一致的显著性图,显著性图中白色表示显著物体区域,黑色表示背景区域。本发明可以得到高分辨率的显著性图,同时能够较好地检测小显著物体。 | ||
搜索关键词: | 一种 基于 注意力 机制 显著 物体 检测 方法 | ||
【主权项】:
1.一种基于注意力机制的显著物体检测方法,其特征在于,包括如下步骤:S1、以VGG‑16作为预训练模型,选取四个侧输出特征分别记为侧输出1~4;侧输出1~4后各增加一个卷积层,卷积层的参数为{1×1×256},卷积层后的输出分别记为F1~F4;S2、在F4后增加四个卷积层,前三个卷积层的参数为{9×9×256},每个卷积层后都附有一个非线性激活层,最后一个卷积层的参数为{1×1×1},得到侧输出4的显著性概率图S4;S3、在F1~F3后分别增加三个注意力模块,用于提纯卷积特征,每个注意力模块的输出作为下一个注意力模块的输入,最后一个注意力模块提纯后的卷积特征分别记为A1~A3;S4、在A1~A3后分别增加一个残差特征融合模块,用于融合不同侧输出的卷积特征,融合后的特征分别记为R1~R3;S5、在R1~R3后分别增加一个卷积层,卷积层的参数为{1×1×1},分别得到侧输出1~3的显著性概率图S1~S3;S6、模型训练:将待检测图像输入至构建后的网络模型,得到不同分辨率的显著性概率图S4~S1,将显著性概率图S4~S1上采样至原图像大小得到显著性概率图
使用交叉熵损失函数计算各个显著性概率图
和真实标注图之间的误差,并将误差进行反向传递以更新整个网络模型参数,具体为:
其中,I(z)和G(z)分别表示输入图像和真值标注图在坐标z处的像素值,|I|表示图像总的像素数目,Pr(G(z)=1|I(z))表示预测为显著物体的概率;Pr(G(z)=0|I(z))表示预测为非显著物体的概率;l表示损失函数;S7、模型检测:将待检测图像直接输入到训练后的网络模型中预测其对应的显著性概率图,并将预测的显著性概率图
通过一个sigmoid层归一化到[0,1]后作为最终输出的显著性检测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州万方电子技术有限责任公司,未经扬州万方电子技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810828215.0/,转载请声明来源钻瓜专利网。