[发明专利]基于视觉注意机制强化学习弱监督图像检测方法、系统有效
申请号: | 201910273048.2 | 申请日: | 2019-04-04 |
公开(公告)号: | CN110084245B | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 张兆翔;张驰;恩擎 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视觉 注意 机制 强化 学习 监督 图像 检测 方法 系统 | ||
1.一种基于视觉注意机制强化学习弱监督图像检测方法,其特征在于,包括:
步骤S10,获取具有弱监督标记的图像作为输入图像;
步骤S20,基于特征提取网络,采用前向传播的方法提取所述输入图像对应的特征表示;所述特征提取网络为基于神经网络构建的用于特征提取的网络;
步骤S30,基于所述特征表示对应的弱监督标记,计算所述特征表示在所述弱监督标记条件下的自顶向下特征表示,对其中的元素值按照从大到小进行重新排序;
步骤S40,采用深度Q网络,依据重新排序后的自顶向下特征表示,构造动作空间、状态空间、奖励空间,计算擦除动作序列;所述深度Q网络,为基于深度神经网络构建的用于计算特征表示在对应的弱监督标记下的动作序列的网络;
步骤S50,依次将所述擦除动作序列中每一个擦除动作作用于输入图像上,直到擦除动作为预设的停止动作,将获得的图像作为检测结果。
2.根据权利要求1所述的基于视觉注意机制强化学习弱监督图像检测方法,其特征在于,步骤S20中“基于特征提取网络,采用前向传播的方法提取所述输入图像对应的特征表示”,其方法为:
fk(u,v)=F(xi)
其中,fk(u,v)为提取特征表示的操作;F代表前向传播算法;xi代表输入图像;k代表特征提取网络中第k个神经元;(u,v)为特征表示的坐标,u为横坐标,v为纵坐标。
3.根据权利要求1所述的基于视觉注意机制强化学习弱监督图像检测方法,其特征在于,步骤S30中“基于所述特征表示对应的弱监督标记,计算所述特征表示在所述弱监督标记条件下的自顶向下特征表示,对其中的元素值按照从大到小进行重新排序”,其方法为:
步骤S31,基于所述特征表示对应的弱监督标记,计算所述特征表示在所述弱监督标记条件下的自顶向下特征表示:
其中,Mc(u,v)为在弱监督标记条件下的自顶向下特征表示,为特征提取网络中第k个神经元与类别c对应的神经元连接的权重;
步骤S32,对获得的弱监督标记条件下的自顶向下特征表示中的元素值采用排序函数从大到小重新进行排序:
其中,Pc(u,v)为排序后的特征表示,rank()为排序函数。
4.根据权利要求1所述的基于视觉注意机制强化学习弱监督图像检测方法,其特征在于,所述深度Q网络,其训练方法为为:
步骤B10,采用步骤S20方法提取训练图像集中每一个图像的特征表示,得到特征表示集;
步骤B20,采用步骤S30方法计算所述特征表示集每一个特征表示在其对应弱监督标记条件下的自顶向下特征表示,对自顶向下特征表示包含的元素值从大到小进行重新排序,获得排序后的自顶向下的特征表示集;
步骤B30,对训练图像集中每个类别都对应一个深度Q网络进行高斯随机初始化;依据所述排序后的自顶向下特征表示集构造动作空间A;根据训练图像集的特征表示以及对应的历史动作构造状态空间S;根据图像分类得分变化、当前图像擦除操作擦除的面积构造奖励空间R;
步骤B40,将构造的状态空间S输入初始化后的深度Q网络,使用前向传播得到动作a,通过动作a对训练图像的影响,计算奖励r;通过深度Q学习算法更新网络的权重;
步骤B50,重复执行步骤B40,直至达到预设的终止条件或预设的训练次数,获得训练好的深度Q网络。
5.根据权利要求4所述的基于视觉注意机制强化学习弱监督图像检测方法,其特征在于,步骤B30中“对训练图像集中每个类别都对应一个深度Q网络进行高斯随机初始化”,其方法为:
采用高斯分布随机初始化深度Q网络的权重:
其中,为高斯分布的均值,α为高斯分布的方差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910273048.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于图像识别物体的方法、智能设备及应用
- 下一篇:一种色织物疵点自动识别方法