[发明专利]基于注意力的重要对象检测方法有效
申请号: | 201811594302.0 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109711463B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 宋凌云;杨宽;刘均 | 申请(专利权)人: | 广东顺德西安交通大学研究院 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/25;G06V10/82;G06N3/0442;G06N3/045;G06N3/0464;G06N3/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 528399 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明一种基于注意力的重要对象检测算法,包括步骤1,建立基于注意力的重要对象检测模型;步骤2,基于注意力的对象定位对基于注意力的重要对象检测模型进行训练;步骤3,利用完成训练的基于注意力的重要对象检测模型对图像的重要对象进行检测。通过考虑人类视觉系统的特点,人类在识别图像时并不会察看图像的所有区域,而是会立即被图像中感兴趣的区域吸引而重点观察这些区域,从而进一步识别和理解整幅图像的语义。从而本发明将图像检测算法和图像注释算法结合起来,利用图像注释算法提供的注意力,快速检测图像中最有可能最在重点对象的区域,大大减少了图像中重点对象的检测时间,提高了对象检测的准确率。 | ||
搜索关键词: | 基于 注意力 重要 对象 检测 方法 | ||
【主权项】:
1.基于注意力的重要对象检测方法,其特征在于,包括如下步骤,步骤1,建立基于注意力的重要对象检测模型;步骤1.1,编码;对图像数据集中的每一幅图像通过编码器进行编码,编码为一个和对应图像成设定比例大小的三维的特征图;步骤1.2,解码;将特征图解码为一句对应图像的文本描述,将文本描述进行分词得到的所有词语分别作为标签,对于每个标签得到一个与对应图像相同尺寸的注意力图,注意力图的每个位置数值的大小表示对应图像中每个位置对于对应标签的重要程度;步骤2,基于注意力的对象定位对基于注意力的重要对象检测模型进行训练;步骤2.1,根据注意力图,选取注意力超过设定阈值的区域,用深度卷积网络识别所选取区域中所包含的对象类别,并生成代表重要对象位置的矩形框区域;步骤2.2,利用感兴趣区域池化抽取矩形框区域的特征,将得到的特征向量并送入全连接层和softmax分类器,计算所选矩形框区域在各个标签上的概率分布;选取概率值最大的标签作为矩形框区域对应的标签;步骤2.3,重复步骤2.1和2.2处理所有的注意力图后,利用所得概率分布进行基于Noisy‑Or的多示例多标签分类,计算整个对应图像在各个标签上的预测概率值
基于获得的预测概率
使用平方差损失函数计算基于注意力的重要对象检测模型的预测概率值与真实概率值之间的误差,利用反向传播算法训练基于注意力的重要对象检测模型的参数;步骤3,利用完成训练的基于注意力的重要对象检测模型对图像的重要对象进行检测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东顺德西安交通大学研究院,未经广东顺德西安交通大学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811594302.0/,转载请声明来源钻瓜专利网。