[发明专利]动态双模板更新的单目标跟踪方法及存储介质在审
申请号: | 202210095816.1 | 申请日: | 2022-01-26 |
公开(公告)号: | CN114387459A | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 符强;梁栩欣;纪元法;孙希延;任风华;贾茜子;梁维彬;付文涛 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06V10/74 | 分类号: | G06V10/74;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳瑞天谨诚知识产权代理有限公司 44340 | 代理人: | 温青玲 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动态 双模 更新 目标 跟踪 方法 存储 介质 | ||
1.动态双模板更新的单目标跟踪方法,其特征在于,包括:
步骤10、读取视频序列;
步骤20、读取视频序列的第一帧图像及其标注数据,进行初始化模板得到模板图像;
步骤30、读取下一帧图像,处理为搜索区域图像;
步骤40、将所述模板图像和所述搜索区域图像同时送入预设强特征提取网络,分别获得模板特征图和搜索区域特征图;
步骤50、对所述模板特征图和搜索区域特征图进行相似度匹配计算,输出相似度得分响应图,得到初步跟踪预测结果。
2.根据权利要求1所述的方法,其特征在于,所述步骤20具体包括:
读取视频序列的第一帧图像的标注数据提供的目标中心点坐标、边界框宽度和边界框长度,即获取目标的真实边界框;
将目标中心点坐标映射到第一帧图像中,基于目标中心点坐标对第一帧图像进行裁剪,得到与边界框宽度和边界框长度对应的图像块;
将裁剪得到的图像块重新采样调整为预设尺寸的图形块,将调整后的图形块作为模板图像。
3.根据权利要求2所述的方法,其特征在于,所述步骤50之后,所述方法还包括:
步骤60、计算所述响应图的置信度,根据所述置信度确定动态双模板更新策略:
如果置信度符合模板备份条件,则根据所述初步跟踪预测结果裁剪当前帧图像保存为备份模板,进入步骤70;
如果置信度符合双模板启动条件,则将初始模板和备份模板加权融合获得新模板,重复步骤40和步骤50后,直接进入步骤70;
如果是其他情况,直接进入步骤70;
步骤70、将所述初步跟踪预测结果作为最终跟踪预测结果。
4.根据权利要求3所述的方法,其特征在于,所述根据所述置信度确定动态双模板更新策略具体包括:
对当前帧响应图的置信度进行判断:将当前帧响应图的置信度记为Ti,预设的置信度上限阈值记为Tu,预设的置信度下限阈值记为Td;所述动态双模板更新策略具体如下:
所述其他情况具体为:当Ti>Td时,将所述初步跟踪预测结果作为最终跟踪预测结果;
所述置信度符合模板备份条件具体为:当Ti>Tu时,将所述初步跟踪预测结果作为最终跟踪预测结果,同时利用所述初步跟踪预测结果裁剪当前帧图像,进行裁剪的参数设置与初始化模板的初始化过程一致,将该裁剪图像保存为所述备份模板;
所述置信度符合双模板启动条件具体为:当Ti<Td时,将所述备份模板和初始模板加权融合为所述新模板,重复步骤40和步骤50后,直接进入步骤70。
5.根据权利要求4所述的方法,其特征在于,所述步骤70之后,所述方法还包括:
重复步骤30到步骤70,直至视频序列的所有图像帧处理完毕,跟踪结束。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述预设强特征提取网络包括预先离线训练的强特征提取网络,所述预先离线训练的强特征提取网络的构建步骤包括:
步骤41、构建改进的Bottleneck模块,在所述改进的Bottleneck模块的末端接入中心裁剪模块以消除特征图填充带来的目标位置偏移影响,由此构成强特征提取网络主体子网络;
步骤42、将多个所述强特征提取网络主体子网络堆叠构成强特征提取网络的主体;
步骤43、在所述强特征提取网络的主体后接入通道空间注意力网络,构成所述预设强特征提取网络。
7.根据权利要求6所述的方法,其特征在于,所述构建改进的Bottleneck模块具体为:
将Bottleneck模块的中间卷积层输出通道数加倍,得到强特征提取网络主体的Bottleneck模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210095816.1/1.html,转载请声明来源钻瓜专利网。