[发明专利]一种鬼影方位视觉注意力学习方法在审
申请号: | 202310088624.2 | 申请日: | 2023-02-09 |
公开(公告)号: | CN116109880A | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 朱建清;陈永平;许荣衔;陈继平;曾焕强;杜吉祥;廖昀 | 申请(专利权)人: | 华侨大学;厦门亿联网络技术股份有限公司 |
主分类号: | G06V10/77 | 分类号: | G06V10/77;G06V10/80;G06V10/82;G06N3/08 |
代理公司: | 泉州市文华专利代理有限公司 35205 | 代理人: | 陈雪莹 |
地址: | 362000 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 方位 视觉 注意力 学习方法 | ||
本发明提供一种鬼影方位视觉注意力学习方法。现有方位视觉注意力学习方法依赖卷积运算进行维度变换以及方位信息学习,计算和参数代价都较高。为此,本发明将轻量的鬼影模块耦合到方位视觉注意力学习方法中,设计降维鬼影模块轻量化压缩特征映射图,随后进行方位信息学习以节约计算和参数代价;设计去冗余鬼影模块降低特征映射图中的冗余信息,能改善特征质量。本发明作为一种新颖的视觉注意力机制有广泛应用,例如图像目标检测、图像目标识别、图像分割等。
技术领域
本发明涉及机器视觉、图像视频应用领域,特别涉及一种鬼影方位视觉注意力学习方法。
背景技术
视觉注意力机制能够抑制输入特征图中的不相关区域,同时突出重点区域的特征,能够有效提升神经网络的特征学习能力,但是使用注意力机制往往会增加模型计算量,拖慢运行速度。例如,方位注意力学习机制中采用多个卷积分支学习横纵方向上的长距离依赖关系,即方位融合信息,由于多次使用卷积模型参数和计算量耗费巨大。
发明内容
本发明提供一种鬼影方位视觉注意力学习方法,利用轻量化的鬼影模块高效率地融合方位信息并减少特征中冗余信息,提高模型特征的学习能力。如图1所示,所述方法包括:
步骤1、轻量化鬼影方位信息学习,设计降维鬼影模块实现轻量化的纵向和横向方位信息学习。
如图2所示,所设计的降维鬼影模块具体做法是:
步骤1.1、对输入特征图X进行特征降维,获得输出特征图F1,计算如公式(1)所示:
其中,表示卷积运算,W为I×J×1×1大小的卷积核,其中I和J=MAX(8,I/32)分别表示输入X的通道数量,输出F1的通道数量;
步骤1.2、对步骤1.1得到的输出特征图F1逐个通道进行轻量的线性运算得到F2,其计算如公式(2)所示:
F2=[Φ1(F11),Φ2(F12),...,Φn(F1n)], n=1,...,J (2)
其中,F1n表示F1中第n个通道上的特征图,Φn表示对F1n进行线性运算;
步骤1.3、拼接步骤1.1得到的输出特征图F1和步骤1.2得到的输出特征图F2,得到通道数量为2J的输出特征图Y,计算如公式(3)所示:
Y=Concat(F1,F2) (3)
其中,Concat表示沿通道维度的拼接操作。
步骤2、轻量化鬼影特征去冗余,设计去冗余鬼影模块减少输入特征图冗余,提升特征质量。
如图3所示,所设计的去冗余鬼影模块具体做法是:
步骤2.1、将输入特征图X进行特征转换,获得特征图G1,计算公式如公式(4)所示:
其中,表示卷积运算,Ω为大小的卷积核,I为X的通道数量,G1的通道数量则为X的一半;
步骤2.2、对步骤2.1得到的输出特征图G1逐个通道进行轻量的线性运算得到G2,其计算公式如公式(5)所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学;厦门亿联网络技术股份有限公司,未经华侨大学;厦门亿联网络技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310088624.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:热水机控制方法、装置、存储介质、控制设备及热水机
- 下一篇:客户前置设备