[发明专利]一种基于三元组网络的目标跟踪稳定性方法在审
| 申请号: | 202110728935.1 | 申请日: | 2021-06-29 |
| 公开(公告)号: | CN113379788A | 公开(公告)日: | 2021-09-10 |
| 发明(设计)人: | 赵凡;张珍珍;惠凯迪;范彩霞;陈亚军 | 申请(专利权)人: | 西安理工大学 |
| 主分类号: | G06T7/20 | 分类号: | G06T7/20;G06N3/04;G06N3/08 |
| 代理公司: | 西安弘理专利事务所 61214 | 代理人: | 曾庆喜 |
| 地址: | 710048 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 三元 组网 目标 跟踪 稳定性 方法 | ||
1.一种基于三元组网络的目标跟踪稳定性方法,其特征在于,具体按照以下步骤实施:
步骤1、设计三元组目标确认网络结构;
步骤2、定义三元组目标确认网络的目标损失函数;
步骤3、离线训练三元组目标确认网络,得到训练后的网络模型Mtri;
步骤4、读取视频V,V={imgk},imgk为第k帧图像,1≤k≤K,K为视频V中的图像总帧数,采用基于三元组网络的目标跟踪稳定性方法对视频V进行目标跟踪,输出目标跟踪结果RS={R′k},R′k表示imgk的目标跟踪框。
2.根据权利要求1所述一种基于三元组网络的目标跟踪稳定性方法,其特征在于,所述步骤1具体过程为:
步骤1中三元组目标确认网络结构由输入模块、特征提取模块和相似性度量模块串联组成;
对三元组数据(x,x+,x-)分别进行归一化处理,得到归一化后的三元组数据(x1,x1+,x1-),三元组数据(x1,x1+,x1-)大小都为w×h×c,把(x1,x1+,x1-)送入网络的输入模块,其中w×h为图像的大小,c为图像的通道数;
特征提取模块包括三个权值共享的卷积网络,每个卷积网络包括5组卷积层和1个最大池化层,具体连接顺序为:[Conv1]—[MaxPool]—[Conv2-1-Conv2-2-Conv2-3]—[Conv3-1-Conv3-2-Conv3-3-Conv3-4]—[Conv4-1-Conv4-2-Conv4-3-Conv4-4-Conv4-5-Conv4-6]—[Conv5-1-Conv5-2-Conv5-3],3个卷积网络在Conv5-3层的输出分别表示为y、y+和y-;
相似性度量模块的输出维度为2,一维为x1和x1+的相似度,另一维为x1和x1-的相似度。
3.根据权利要求1所述一种基于三元组网络的目标跟踪稳定性方法,其特征在于,所述步骤2具体过程为:
定义三元组目标确认网络的目标损失函数,如下公式(1)所示:
L((x,x+,x-);γ;S)=max{0,γ-S(y,y+)+S(y,y-)} (1);
其中,S(y,y+)表示y和y+之间的余弦相似度,S(y,y-)表示y和y-之间的余弦相似度,γ为阈值参数,max()为求最大值函数。
4.根据权利要求1所述一种基于三元组网络的目标跟踪稳定性方法,其特征在于,所述步骤3具体过程为:
步骤3.1、制作训练样本集Mtrain和标签文件label;
步骤3.2、设置网络模型参数,将训练样本集Mtrain和标签文件label按批量送入三元组目标确认网络中进行训练,当目标函数L收敛或者达到设置的最大迭代次数时,结束网络训练,输出网络模型Mtri。
5.根据权利要求1所述一种基于三元组网络的目标跟踪稳定性方法,其特征在于,所述步骤4具体过程为:
步骤4.1、输入视频V,V={imgk},其中imgk为第k帧图像,图像大小为width×height,其中width、height分别为imgk的宽度和高度,1≤k≤K,K为视频总帧数;
步骤4.2、在图像imgk中对目标进行手动框选,得到目标的矩形框R′k,在imgk中提取矩形框R′k对应的图像区域Objk,即为目标图像,Objk大小为Obj_wk×Obj_hk,其中Obj_wk、Obj_hk分别为Objk的宽和高;
步骤4.3、定义交并比阈值变量overlap,对R′k进行尺度扩展得到扩展后的矩形框Rk,在imgk中提取Rk对应区域的HOG特征Feak,在Feak中通过循环移位构建训练样本xk;
步骤4.4、把Feak作为输入,执行KCF算法中的训练模块,得到岭回归系数αk;
步骤4.5、k=k+1,读取imgk,执行KCF跟踪算法中的跟踪模块,得到跟踪候选目标Trak;
步骤4.6、采用FasterR-CNN通用目标检测器对第k帧图像imgk进行目标检测,得到检测的候选目标集合Deck,表示imgk中检测的第n个目标,0≤n≤N,N为检测的目标总个数;
步骤4.7、计算Trak与Deck中各个元素在空间位置上的交并比,记为Iouk,求Iouk中的最大值如果则输出对应的检测目标,即最佳检测目标否则,将Trak作为跟踪结果Objk,并在视频图像imgk中输出Objk对应的矩形框R′k,转入步骤4.9;
步骤4.8、将Trak、和Objk-1作为输入,送入三元组目标确认网络模型Mtri,输出得到确认后的目标Objk,并在视频图像imgk中输出Objk对应的矩形框R′k;
步骤4.9、如果k≥K,跟踪结束,否则转入步骤4.3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110728935.1/1.html,转载请声明来源钻瓜专利网。





