[发明专利]一种基于注意力机制的改进HRnet在审
申请号: | 202011084171.9 | 申请日: | 2020-10-12 |
公开(公告)号: | CN112270213A | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 王聪;乔元风;蒋伟;柯钦瑜;黄勇;李紫薇 | 申请(专利权)人: | 萱闱(北京)生物科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 郑州中原专利事务所有限公司 41109 | 代理人: | 李想 |
地址: | 100010 北京市东城区王府井*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 改进 hrnet | ||
1.一种基于注意力机制的改进HRnet,其特征在于:当输入
表示在通道维度上做注意力提取的操作,即建立通道注意力机制模型,表示的是在空间维度上做注意力提取的操作,即建立空间注意力机制模型。
2.根据权利要求1所述的基于注意力机制的改进HRnet,其特征在于:所述的通道注意力机制模型为:原始特征图Xin 经过卷积核大小分别为3X3,5X5的卷积操作,得到特征图U和特征图V,然后相加得到特征图F,特征图F融合多个感受野的信息,其形状为[C,H,W],其中,C代表通道,H代表高度,W代表宽度,然后沿着H和W维度求平均值和极大值,通过两个pooling函数以后总共得到两个一维矢量;然后对两个一维矢量进行元素相加,最终得到了关于通道的信息是一个1×1×C的一维向量,代表的是各个通道的信息的重要程度;对1×1×C一维向量进行一个线性变换,将原来的C维映射成Z维的信息,然后将映射成Z维的一维向量再分别使用了2个线性变换,从Z维变为原来的C维,从而完成了针对通道维度的信息提取,然后使用Softmax进行归一化,这时候每个通道对应一个分数,代表该通道的重要程度,这相当于一个mask;将这2个分别得到的mask分别乘以对应的特征图U,V,得到特征图U’,V’;然后对特征图U’和V’这2个模块相加,进行信息融合,得到最终模块Xout。
3.根据权利要求1所述的基于注意力机制的改进HRnet,其特征在于:空间注意力机制模型为:输入原始特征图Xin经过池化特征,其中池化特征包含3个池化层,分别是平均池化,最大池化和条纹池化,池化特征经过1X1的卷积操作,实现通道降维,得到通道数为1的特征图,该特征图经过Sigmoid函数,与输入原始特征图 Xin进行逐元素分别进行点乘,得到输出Xout。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于萱闱(北京)生物科技有限公司,未经萱闱(北京)生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011084171.9/1.html,转载请声明来源钻瓜专利网。