[发明专利]一种基于FPN神经网络的目标跟踪方法有效
申请号: | 201810329415.1 | 申请日: | 2018-04-13 |
公开(公告)号: | CN108830878B | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 罗均;高建焘;李小毛;谢少荣;彭艳 | 申请(专利权)人: | 上海大学 |
主分类号: | G06T7/20 | 分类号: | G06T7/20;G06N3/08 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 陆聪明 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 fpn 神经网络 目标 跟踪 方法 | ||
本发明提出了一种基于FPN神经网络的目标跟踪方法。该方法不再使用传统的VGG深度神经网络,而是改用FPN深度神经网络。利用FPN深度神经网络中对神经网络浅层网络输出的深度特征图所具有的空间信息和深层网络输出的深度特征图所具有的判别能力很好的融合能力,从而提高目标跟踪精度。该方法是一种实时鲁棒性的跟踪算法,在不同的跟踪场景中取得了不错的效果。
技术领域
本发明属于计算机视觉技术领域,具体涉及一种基于FPN神经网络的目标跟踪方法。
背景技术
目标跟踪由于其在行为分析、车辆导航、人机交互、医学成像、视频监控等众多领域都有着广阔的应用,从而成为计算机视觉技术最活跃的研究之一。目标跟踪是指在给定视频第一帧中的目标位置,对之后的每一帧进行目标定位。目标跟踪的核心问题紧跟随着时间不断变化的目标。尽管近年来在国内外学者的不断研究下,目标跟踪算法得到了迅速发展,但在光照变化剧烈、目标快速运动、部分遮挡等情况下仍然无法取得很好效果。
近年来,国内外学者提出了多种跟踪算法,主要可以分成两类:一类是基于对于目标本身进行描述和刻画的生成式模型;另一类旨在将目标和背景分离开的判别式模型。生成式模型重点在于建立目标外观模型的表征,虽然构建有效的外观模型以处理跟踪中的各种具有挑战性的情况至关重要,但是与此同时,也会增加很大的计算复杂度,并且还会丢弃了可用于更好地将对象与背景分离的目标区域周围的有用信息;判别式模型将跟踪问题转换为目标和背景的二分类问题,即把跟踪的目标作为前景,利用在线学习或离线训练的判断器来区分前景目标和背景,从而得到前景目标的位置。在进行判断前往往会进行特征提取,以作为判断依据提高判断的精确度,但是这也会导致有大量的候选样本需要进行特征提取,使得难以达到实时性。
相关滤波是一种传统的信号处理方法,其描述了两个样本之间的相似程度。2010年MOSSE算法将其引入到目标跟踪中,从而使得跟踪算法速度达到高速状态,但是由于其采用的是随机采样,从而导致正负训练数目不足而使得精度较低。2012年CSK算法基于MOSSE算法通过建立循环位移的结构将目标进行稠密采样,以此增加正负样本的数目,以此解决目标跟踪之中训练样本不足的问题。除此之外,通过对于这些样本进行循环位移的处理,将对目标样本的计算转化到频率域中的求解,通过使用快速傅里叶变换的方法,大大地提高目标跟踪的效率。然而CSK算法采用的是单通道灰度特征,在特征表征上不够鲁棒。针对以上问题,2015年CN算法改用多通道的颜色特征,KCF算法改用多通道HOG特征,使得精度得到提高。但是CN算法和KCF算法在卷积求解中使用的固定大小的模板,从而导致模型没有尺度自适应的功能,DSST算法在原本的位置滤波器基础上增加了一个尺度滤波器,FDSST算法在DSST算法的基础上进行改进增加其跟踪速度,SAMF算法通过多尺度采样获取候选样本来使得模型具有尺度适应性。由于使用循环位移构造样本增加正负样本数量,图像像素会跨越边界,这样就产生的错误样本,使得分类器判别力降低,即所谓的边界效应。2015年提出的SRDCF算法通过引入成一种符合空间约束的正则化权重系数从而极大地减小了边界效应,提高了跟踪精度。基于相关滤波的跟踪算法属于判别式跟踪算法,其在进行判断前往往会进行特征提取,以作为判断依据提高判断的精确度,特征的表征能力在很大程度上决定了跟踪效果。自从2012年Hinton利用AlexNet深度卷积神经网络在ImageNet图像分类比赛中一举获得第一后,深度卷积神经网络开始兴起,其在许多任务中也展现了其令人惊叹的性能,特别是其所具有的强大的特征提取能力。2015年提出DeepSRDCF算法将VGG深度卷积神经网络应用于SRDCF算法中,使得精度得到进一步的提高,但是其只能使用单层神经网络所输出的特征图,这一局限极大地限制了其原本具有的潜力。2016年C-COT算法通过训练连续性卷积滤波器的方法,从而使得能有效地结合多层神经网络输出的深度特征图。但是C-COT算法结合多层神经网络输出的深度特征图的方式只是在高维度空间上进行简单地结合,并没有很好地融合神经网络浅层网络输出的深度特征图所具有的空间信息和深层网络输出的深度特征图所具有的判别能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810329415.1/2.html,转载请声明来源钻瓜专利网。