[发明专利]一种基于置信度增强的相关滤波视觉跟踪方法有效
申请号: | 202010045222.0 | 申请日: | 2020-01-16 |
公开(公告)号: | CN111260689B | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 宋奇奇;李晓丽;左伟;柯天成 | 申请(专利权)人: | 东华大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06T7/277 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 徐俊 |
地址: | 201600 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 置信 增强 相关 滤波 视觉 跟踪 方法 | ||
1.一种基于置信度增强的相关滤波视觉跟踪方法,其特征在于,包括以下步骤:
步骤1、位置滤波器和尺度滤波器训练,包括以下步骤:
步骤101、在视频序列的第一帧图像中,在初始化信息中获取目标的位置坐标和尺度,并设置目标候选框的尺寸;
步骤102、设计两个二维的相关滤波器用于预测目标的位置,其中一个二维的相关滤波器直接提取目标候选框的方向梯度直方图特征和灰度特征作为输入特征,另一个二维的相关滤波器则先对候选框进行循环移位处理后,再进行提取颜色特征、方向梯度直方图特征和灰度特征作为输入特征;
设计一个一维的相关滤波器用于预测目标的尺度,一维的相关滤波器只提取方向梯度直方图特征构成一维特征作为输入特征;
步骤103、用二维和一维高斯分布函数生成理想的响应图作为第一帧图像的理想输出;
步骤104、由输入特征和理想输出得到对应的最初相关滤波器模型,用于后续帧的目标检测与跟踪和模型更新的基础;
步骤2、根据响应图计算置信度,对候选框提取输入特征,与步骤1中的对应的相关滤波器模型作运算得到当前帧的输出响应图;找出输出响应图中的主峰和所有次峰,并计算次峰均值与主峰均值的比值SMR,用于作为是否进行位置估计和决定更新策略的依据;将比值SMR和峰值旁瓣比PSR的组合值conf作为输出响应图的置信度评价标准;
组合值conf的计算公式为:
相关滤波响应的主峰均值SMR定义为:
式中,mean(secpeaks)为次峰均值,mainpeak为主峰均值;
步骤3、利用历史帧位置信息通过最小二乘法拟合轨迹估计目标位置,计算步骤2中主峰均值的比值SMR的均值,在此基础上设置阈值,如果当前帧的输出响应图的输出响应值大于该阈值,说明目标可能被遮挡或存在异常,则利用历史帧的目标位置信息对当前帧的目标位置预测,对目标位置进行微调;
步骤4、不同相关滤波器响应图的融合:
将两个具有不同采样方式和提取特征的滤波器模型根据步骤2提出的作为置信度评价标准的组合值conf进行融合,并把最终响应图最大值所在的位置作为目标的中心位置;
通过将两个具有不同采样方式和提取特征的滤波器模型根据步骤2提出的作为置信度评价标准的组合值conf进行融合得到的当前帧的实际响应值为y:
式中,为傅里叶逆变换,confK、confF为两个二维的相关滤波器在当前帧的置信度;为核函数矩阵的离散傅里叶变换,为x的非线性映射函数,为z的非线性映射函数;为滤波器一的频域中的滤波器模型;为滤波器二的滤波器模型分子;Zl为当前帧的输入;B为滤波器二的滤波器模型分母;λF为正则化项系数;
步骤5、自适应学习率更新滤波器模型:
根据步骤1提出的主峰均值SMR设置不同的阈值区间,赋予滤波器模型不同的学习率,制定自适应的模型更新策略,缓解滤波器被污染的问题。
2.如权利要求1所述的一种基于置信度增强的相关滤波视觉跟踪方法,其特征在于,步骤2中,对于相关滤波响应,在峰值位置x处的PSR(x)定义为:
式中,max(x)为响应图中的峰值,μ(x)和σ(x)分别为均值和标准差,PSR(x)的值越大表示响应图的置信度越高,反之则表示响应图的置信度较差。
3.如权利要求1所述的一种基于置信度增强的相关滤波视觉跟踪方法,其特征在于,步骤3中,利用历史帧的目标位置信息对当前帧的目标位置预测包括以下步骤:
设帧与帧之间的时间间隔Δt为1个单位,对于当前时刻t的当前帧ft的前若干帧,存在目标水平的位置(t-1,xt-1),(t-2,xt-2),(t-3,xt-3),…,(t-m,xt-m),(m1),即相对当前帧的前若干帧,相同的时间间隔时刻对应目标位置的水平坐标xt和垂直坐标yt;
设后续帧的目标位置为(xt+1,yt+1),为了充分利用历史帧的正确的位置信息,设有多项式P(t):
式中k是多项式的最高次数,用最小二乘法的思想求解系数a0,......,ak,对于
令σ=0,则上式可以表示为矩阵TA=X,其中
通过矩阵的基本运算可解得系数矩阵A的解,即有:
A=W-1TTX
其中W=TTT,TT为T的转置矩阵,由a0,a1,......,ak、b0,b1,......,bk估计下一帧中的目标位置为:
式中,b0,b1,......,bk为预测坐标点纵坐标对应的多项式系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010045222.0/1.html,转载请声明来源钻瓜专利网。