[发明专利]目标检测方法在审
申请号: | 202210009182.3 | 申请日: | 2022-01-06 |
公开(公告)号: | CN114332734A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 马玉辉;肖保臣;孙运;郭子瑜;李学伟;李军;郎公福 | 申请(专利权)人: | 齐鲁空天信息研究院 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06N3/04;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 张博 |
地址: | 250100 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 方法 | ||
1.一种目标检测方法,包括:
对目标视频进行预处理,将所述目标视频分成K个等长的视频单元,K为大于1的正整数;
将所述视频单元切分成连续的视频帧,并对所述视频帧进行稀疏采样,得到所述视频帧的RGB图像;
根据连续的所述RGB图像生成三组热图,其中,所述三组热图包括:边界框左上角热图、边界框右下角热图、中心热图;
通过置信度分数从三组所述热图上分别选取N个左上角点、右下角点和中心关键点,N为大于1的正整数;
通过计算所述左上角点和所述右下角点的嵌入向量距离来判断所述左上角点和所述右下角点是否属于同一个物体;
在检测到属于所述同一个物体后,通过计算所述左上角点和所述右下角点的偏移量来筛选目标边界框;
通过检测所述目标边界框中的所述中心关键点来确定是否保留所述目标边界框;
输出保留的目标边界框的坐标信息和目标类别。
2.根据权利要求1所述的方法,每组所述热图具有多个通道,每个所述通道是二进制掩码,用于表示所述通道的所述左上角点和所述右下角点的位置,所述左上角点和所述右下角点有一个ground-truth的正值位置,其他位置为负值。
3.根据权利要求2所述的方法,所述边界框与所述ground-truth的交并比IoU,根据所述IoU确定半径集合,减少对正值位置半径内的负值位置给予惩罚,对于给定半径处罚的减少量由非标准化的2D高斯函数决定,表示为:
式(1)中,σ是所述半径的1/3,(x,y)是所述RGB图像中所述目标的位置信息,通过非标准化的2D高斯函数,得出局部损失函数Ldet,表示为:
式(2)中,N是所述RGB图像中所述目标的数量,α和β是控制每个点贡献的超参数,初始值设置为2和4,为所述热图中c类位置(i,j)的所述置信度分数,由式(1)得出,利用中编码的高斯凸点,通过减少ground-truth周围的惩罚。
4.根据权利要求3所述的方法,在检测所述目标时为每个检测到的所述左上角点和所述右下角点生成所述嵌入向量,根据所述嵌入向量的距离对所述左上角点和所述右下角点进行分组,具体通过使用1维嵌入向上损失函数来对所述左上角点和所述右下角点进行分组,并用向上损失函数Lp来区分所述左上角点和所述右下角点,表示为:
式(3)中,cil为所述目标的所述左上嵌入向量,cjl为所述目标的所述右下嵌入向量,cl为cil和cjl的平均值。
5.根据权利要求4所述的方法,通过采样方法计算所述左上角点、所述右下角点和所述中心关键点的所述偏移量Ok,表示为:
式(4)中,xk和yk是角点k的x和y坐标,和是角点k映射到所述热图中的坐标。
6.根据权利要求5所述的方法,计算偏移损失函数Loffset,表示为:
式(5)中,L1s为最小绝对值偏差,Ok为式(4)中得出的所述偏移量,Y为目标值,f(xi)为估计值。
7.根据权利要求6所述的方法,通过所述局部损失函数Ldet、所述向上损失函数Lp和所述ground-truth的L1偏移损失函数Loffset来计算损失函数f(loss),表示为:
式(8)中,为所述左上角点和所述右下角点的所述局部损失函数,为所述中心关键点的所述局部损失函数,Lp为所述向上损失函数,为所述左上角点和所述右下角点的所述偏移损失函数,为所述中心关键点的所述偏移损失函数,θ和ω为权重因子,通过所述损失函数f(loss)对算法进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁空天信息研究院,未经齐鲁空天信息研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210009182.3/1.html,转载请声明来源钻瓜专利网。