[发明专利]用于卷积神经网络的注意力权重模块和方法在审
申请号: | 201911115359.2 | 申请日: | 2019-11-14 |
公开(公告)号: | CN112801262A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 李永;吴岳辛;王伟刚;叶翔;张高鑫;李婉婷;刘莹;施方;李珂嘉 | 申请(专利权)人: | 波音公司;北京邮电大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/46 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 刘彬 |
地址: | 美国伊*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 卷积 神经网络 注意力 权重 模块 方法 | ||
1.一种用于卷积神经网络的注意力权重模块,其特征在于,所述注意力权重模块包括:
提取单元,被配置为从输入至所述卷积神经网络的特征图中提取特征向量;
生成单元,被配置为将所述特征向量馈送至完全连接层,以生成注意力向量;
权重分配单元,被配置为基于所述注意力向量将权重分配至所述特征图。
2.根据权利要求1所述的注意力权重模块,其特征在于,所述注意力权重模块还包括:
分组单元,被配置为将所述注意力向量分为两个以上的注意力向量组,并且
所述权重分配单元,被配置为基于所述注意力向量或基于所述注意力向量组将权重分配至所述特征图。
3.根据权利要求1所述的注意力权重模块,其特征在于
所述提取单元通过空间自适应池化处理从所述特征图中提取所述特征向量。
4.根据权利要求3所述的注意力权重模块,其特征在于,所述空间自适应池化处理具有随机采样因子,并且所述空间自适应池化处理包括平均池化处理和最大池化处理。
5.根据权利要求1所述的注意力权重模块,其特征在于
在所述生成单元中,所述完全连接层包括第一完全连接层和第二完全连接层,其中,所述特征向量依次通过:所述第一完全连接层、ReLU函数、所述第二完全连接层、sigmoid函数。
6.一种用于卷积神经网络的卷积层的注意力权重模块,其特征在于,所述注意力权重模块包括:
提取单元,被配置为从输入至所述卷积神经网络的第一特征图中提取特征向量z,所述第一特征图的维度为H×W×C;
生成单元,被配置为将所述特征向量z馈送至完全连接层,以生成注意力向量s;
权重修正单元,被配置为基于所述注意力向量s修正所述卷积层的卷积核W,得到修正后的卷积核Wrec;
卷积单元,配置为将所述修正后的卷积核Wrec与所述第一特征图进行卷积,从而得到第二特征图。
7.根据权利要求6所述的注意力权重模块,其特征在于,所述注意力权重模块还包括:
分组单元,被配置为将所述注意力向量s分为两个以上的注意力向量组,并且
所述权重修正单元,被配置为基于所述注意力向量s或基于所述注意力向量组修正所述卷积层的卷积核W,得到修正后的卷积核Wrec。
8.根据权利要求6所述的注意力权重模块,其特征在于,所述提取单元通过空间自适应池化处理从所述特征图中提取所述特征向量。
9.根据权利要求8所述的注意力权重模块,其特征在于,所述空间自适应池化处理具有随机采样因子k,所述特征向量z的维度为C×k×k,并且所述空间自适应池化处理包括平均池化处理和最大池化处理。
10.根据权利要求9所述的注意力权重模块,其特征在于
在所述生成单元中,所述完全连接层包括第一完全连接层和第二完全连接层,所述第一完全连接层的维度W1=λ/r×C×k×k,所述第二完全连接层的维度W2=λ/r×λ,其中,r为预设的下采样因子,λ为所述注意力向量s的长度,其中,在所述生成单元中,所述特征向量z依次通过以下各项从而生成所述注意力向量s:所述第一完全连接层、ReLU函数、所述第二完全连接层、sigmoid函数,其中,所述注意力向量s的计算公式如下:
s=σ(W2δ(W1z))。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于波音公司;北京邮电大学,未经波音公司;北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911115359.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:车辆和车辆控制方法
- 下一篇:铸铝合金工件的处理方法及其炊具