[发明专利]一种弱监督目标检测方法及装置有效
申请号: | 201910507821.7 | 申请日: | 2019-06-12 |
公开(公告)号: | CN110222704B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 张海涛;杜沛伦;马华东 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/46;G06V10/98;G06V10/774;G06V10/82;G06K9/62 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;赵元 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监督 目标 检测 方法 装置 | ||
1.一种弱监督目标检测方法,其特征在于,所述方法包括:
提取待检测图像的图像特征;所述待检测图像中包含至少一个待检测物体;
基于提取的图像特征,确定针对每个待检测物体的初始检测结果,每个初始检测结果为包含一个待检测物体的初始检测框;所述基于提取的图像特征,确定针对每个待检测物体的初始检测结果,包括:将提取的图像特征输入初始检测神经网络,得到针对每个待检测物体的初始检测结果,所述初始检测神经网络包括两个子网络,分别为特征定位网络和特征分类网络;
基于提取的图像特征,确定每个所述待检测物体的显著区域;
基于每个所述显著区域,对每个所述初始检测结果进行优化,得到针对每个待检测物体的目标检测结果;
所述基于每个所述显著区域,对每个所述初始检测结果进行优化,得到针对每个待检测物体的目标检测结果的步骤,包括:
将每个所述初始检测结果输入优化网络,得到针对每个待检测物体的目标检测结果,所述优化网络是根据样本数据训练得到的,所述样本数据包括:多个包含至少一个样本物体的样本图像,每个样本图像针对该样本图像中每个样本物体的初始样本检测结果,以及每个样本图像针对该样本图像中每个样本物体的样本显著区域;
所述优化网络按照如下方法训练:
获取预设的神经网络模型和训练集;
将所述初始样本检测结果输入所述神经网络模型,计算所述初始样本检测框内物体属于该初始样本检测框对应的样本物体的概率;
基于所述概率确定损失值;
基于所述损失值确定所述神经网络模型是否收敛;
若所述神经网络模型未收敛,则调整所述神经网络模型中的参数,并基于调整后的参数生成样本检测框;
判断新生成的样本检测框是否包含对应的样本显著区域,若是,则返回计算所述样本检测框内物体属于该样本检测框对应的样本物体的概率;若否,则返回调整所述神经网络模型中的参数;
若所述神经网络模型已收敛,则将收敛的神经网络模型确定为所述优化网络。
2.根据权利要求1所述的方法,其特征在于,所述基于提取的图像特征,确定每个所述待检测物体的显著区域的步骤,包括:
基于所述图像特征,确定针对每个待检测物体的特征激活图;
针对每个待检测物体,将该待检测物体的特征激活图中像素点大于预设阈值的区域,确定为显著区域。
3.一种弱监督目标检测装置,其特征在于,所述装置包括:
提取模块,用于提取待检测图像的图像特征;所述待检测图像中包含至少一个待检测物体;
第一确定模块,用于基于提取的图像特征,确定针对每个待检测物体的初始检测结果,每个初始检测结果为包含一个待检测物体的初始检测框;所述第一确定模块,具体用于:将提取的图像特征输入初始检测神经网络,得到针对每个待检测物体的初始检测结果,所述初始检测神经网络包括两个子网络,分别为特征定位网络和特征分类网络;
第二确定模块,用于基于提取的图像特征,确定每个所述待检测物体的显著区域;
优化模块,用于基于每个所述显著区域,对每个所述初始检测结果进行优化,得到针对每个待检测物体的目标检测结果;
所述优化模块,具体用于:
将每个所述初始检测结果输入优化网络,得到针对每个待检测物体的目标检测结果,所述优化网络是根据样本数据训练得到的,所述样本数据包括:多个包含至少一个样本物体的样本图像,每个样本图像针对该样本图像中每个样本物体的初始样本检测结果,以及每个样本图像针对该样本图像中每个样本物体的样本显著区域;
所述装置还包括:训练模块,所述训练模块用于训练优化网络;所述训练模块具体用于:
获取预设的神经网络模型和训练集;
将所述初始样本检测结果输入所述神经网络模型,计算所述初始样本检测框内物体属于该初始样本检测框对应的样本物体的概率;
基于所述概率确定损失值;
基于所述损失值确定所述神经网络模型是否收敛;
若所述神经网络模型未收敛,则调整所述神经网络模型中的参数,并基于调整后的参数生成样本检测框;
判断新生成的样本检测框是否包含对应的样本显著区域,若是,则返回计算所述样本检测框内物体属于该样本检测框对应的样本物体的概率;若否,则返回调整所述神经网络模型中的参数;
若所述神经网络模型已收敛,则将收敛的神经网络模型确定为所述优化网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910507821.7/1.html,转载请声明来源钻瓜专利网。