[发明专利]一种基于attention机制的小物体识别方法在审
申请号: | 202310256321.7 | 申请日: | 2023-03-16 |
公开(公告)号: | CN116310547A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 史昕龙;孙国梁;刘华海;陆鲁;周柏印;杨欣悦;张大伟;张欧;陈巍杰;朱珠 | 申请(专利权)人: | 上海环境物流有限公司;上海城投环境(集团)有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V20/70;G06N3/0464 |
代理公司: | 上海科律专利代理事务所(特殊普通合伙) 31290 | 代理人: | 柯丽芳 |
地址: | 200063 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 attention 机制 物体 识别 方法 | ||
1.一种基于attention机制的小物体识别方法,其特征在于,包括如下步骤:
S1:采集训练图像,在图像中标记出物体位置并标注物体分类,得到物体分类及位置的数据集;
S2:建立识别模型,将训练图像输入到识别模型中进行训练,得到训练好的识别模型;
S3:将待识别图像输入到识别模型得到分类识别结果。
2.如权利要求1所述的基于attention机制的小物体识别方法,其特征在于,所述步骤S2包括如下步骤:
S21:对训练图像进行数据增强处理,采用迭代的方式加载训练图像到识别模型;
S22:通过识别模型的特征提取网络,对数据增强后的训练图像进行特征提取,得到特征图;
S23:通过识别模型的注意力学习网络,对所述特征图进行卷积运算分析,得到注意图,所述注意图中包含元素在训练图像中的位置坐标;
S24:进行注意力导向数据增强,对注意图进行处理,得到注意区域边界框,在训练图像中设置注意区域边界框并将其作为扩展的样本图像加载到识别模型,用以调整优化网络参数;
S25:将所述特征图与每个通道的所述注意图相乘得到注意部分特征图,然后通过识别模型的注意力集中特征池化网络,对注意部分特征图进行池化降维后,拼接得到特征矩阵;
S26:将所述特征矩阵输入到识别模型的线性分类网络,得到目标识别结果,根据目标识别结果与训练图像中物体分类及位置的数据集进行对比调整优化网络参数;
S27:根据学习率调整策略,重复步骤S21-S26,完成识别模型训练。
3.如权利要求2所述的基于attention机制的小物体识别方法,其特征在于,所述步骤S24包括:
S241:对注意图进行归一化处理,归一化公式如下:
S242:将归一化处理后的注意图中大于设定阈值的元素置为1,其他置为0,然后将可以覆盖选定的值为1的区域的最小边界框作为注意区域边界框;
S243:在训练图像中对应设置注意区域边界框,将其加载到识别模型,并将抹去注意区域边界框外部区域后的训练图像加载到识别模型,对识别模型进行训练,使得识别模型关注注意区域,调整优化网络参数。
4.如权利要求3所述的基于attention机制的小物体识别方法,其特征在于,所述步骤S26中根据目标识别结果与训练图像中物体分类及位置的数据集进行对比,包括:计算损失函数,包括交叉熵损失和中心损失,交叉熵损失包括通过训练图像直接分类的交叉熵损失、通过设置注意区域边界框的训练图像分类的交叉熵损失和通过设置注意区域边界框并抹去外部区域后的训练图像分类的交叉熵损失;中心损失加入了特征图与部位中心的平方差之和作为惩罚项,求取损失后进行反向传播调整优化网络参数,重复完成迭代优化直到训练完毕。
5.如权利要求1所述的基于attention机制的小物体识别方法,其特征在于,所述步骤S3包括如下步骤:
S31:将待识别图像输入到识别模型,得到注意图和注意图中各个元素属于各个类别的概率;
S32:对多个注意图取平均值,根据平均值在待识别图像上标注裁剪框,得到裁剪区域;
S33:将裁剪区域作为扩展的待识别图像输入到识别模型,得到扩展的注意图和注意图中各个元素属于各个类别的概率;
S34:将步骤S31中的识别结果与步骤S33中的识别结果取平均值,得到最终的识别结果。
6.如权利要求5所述的基于attention机制的小物体识别方法,其特征在于,所述步骤S31包括:
S311:通过识别模型的特征提取网络,对待识别图像进行特征提取,得到特征图;
S312:通过识别模型的注意力学习网络,对所述特征图进行卷积运算分析,得到注意图,所述注意图中包含元素在待识别图像中的位置坐标;
S313:将所述特征图与每个通道的所述注意图相乘得到注意部分特征图,然后通过识别模型的注意力集中特征池化网络,对注意部分特征图进行池化降维后,拼接得到特征矩阵;
S314:将所述特征矩阵输入到识别模型的线性分类网络,得到识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海环境物流有限公司;上海城投环境(集团)有限公司,未经上海环境物流有限公司;上海城投环境(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310256321.7/1.html,转载请声明来源钻瓜专利网。