[发明专利]一种基于PVANET神经网络的目标跟踪方法有效
申请号: | 201810584860.2 | 申请日: | 2018-06-08 |
公开(公告)号: | CN108898619B | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 罗均;高建焘;李小毛;谢少荣;彭艳 | 申请(专利权)人: | 上海大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06N3/04 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 陆聪明 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于PVANET神经网络的目标跟踪方法。该方法不再使用Edgeboxes算法进行不同尺度的候选样本的提取,而是改用PVANET神经网络进行深度特征提取,并将浅层网络输出具有的空间信息的深度特征和深层网络输出的具有的判别能力的深度特征进行融合,在融合后的深度特征的基础上,利用PVANET神经网络中的RPN层进行不同尺度的候选样本的提取,并同时输出候选样本所对应的融合后的深度特征。该方法在利用神经网络中具有强大表征能力的深度特征的基础上,进行特征融合和不同尺度的候选样本的提取,从而提高目标跟踪精度。该方法是一种鲁棒性的跟踪算法,能在不同的跟踪场景中取得不错的效果。 | ||
搜索关键词: | 一种 基于 pvanet 神经网络 目标 跟踪 方法 | ||
【主权项】:
1.一种基于PVANET神经网络的目标跟踪方法,其特征在于,具体步骤包括:步骤一、对于第一帧图像t=1,跟踪任务给予的第一帧跟踪目标的中心位置(xt,yt)以及跟踪目标区域大小信息(lt,ht),对跟踪目标区域进行一定比例的扩大(lp,t,hp,t)=α(lt,ht),根据目标中心位置(xt,yt)以及扩大后的跟踪目标区域大小(lp,t,hp,t)在该帧图像中进行采样,得到训练样本;其中xt为跟踪目标中心位置的横坐标,yt为跟踪目标中心位置的纵坐标,lt为原跟踪目标区域的长度,ht为原跟踪目标区域的宽度,α为扩大比率,lp,t为扩大后跟踪目标区域的长度,hp,t为扩大后跟踪目标区域的宽度;步骤二、对于在第一帧图像中采样得到的训练样本T,将其输入到PVANET神经网络中,提取出PVANET神经网络中的Convf层输出的分类特征
其中ZT表示PVANET神经网络中通道数为512的Convf层输出的分类特征,
表示PVANET神经网络中的Convf层输出的分类特征ZT中第n维特征;步骤三、将训练样本T经过PVANET神经网络后提取得到的Convf层输出的分类特征
用于相关滤波器参数的计算;步骤四、对于下一帧图像t+1,根据上一帧跟踪目标中心位置(xt,yt)以及扩大后的跟踪目标区域大小(lp,t,hp,t),根据目标中心位置(xt,yt)以及扩大后的跟踪目标区域大小(lp,t,hp,t)在该帧图像中进行采样,得到候选区域样本P;步骤五、对于采样得到的候选区域样本P,将其输入到PVANET神经网络中,提取出PVANET神经网络中的RPN层输出的离上一帧跟踪目标中心位置(xt,yt)最近的5个候选框,并对这五个候选框依据步骤一中的扩大比率α进行背景信息的添加,而后进行采样并变形至步骤一中的跟踪目标区域大小(lp,t,hp,t),从而构成的候选样本集X=(X1 X2 … X5),以及这5个候选样本构成的候选样本集X所对应的Convf层输出的分类特征
其中
表示第一个候选样本X1对应PVANET神经网络中的Convf层中输出的通道数为512的分类特征,即
步骤六、将候选样本集每个候选样本所对应的Convf层输出的分类特征
用于响应图的计算,最终确定该帧跟踪目标的中心位置(xt+1,yt+1)和跟踪目标区域大小(lt+1,ht+1);步骤七、在得到跟踪目标的中心位置和区域大小后,不断重复步骤一至步骤六,直到视频结束,完成对跟踪目标的中心位置以及区域大小的跟踪。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810584860.2/,转载请声明来源钻瓜专利网。