[发明专利]基于神经网络的图像目标跟踪算法在审
| 申请号: | 201611271054.7 | 申请日: | 2016-12-30 |
| 公开(公告)号: | CN106651917A | 公开(公告)日: | 2017-05-10 |
| 发明(设计)人: | 于瑞国;刘凯;于健;王建荣;喻梅;徐天一 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06T7/246 | 分类号: | G06T7/246 |
| 代理公司: | 天津市北洋有限责任专利代理事务所12201 | 代理人: | 程小艳 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 神经网络 图像 目标 跟踪 算法 | ||
技术领域
本发明属于人工神经网络和计算机视觉领域,涉及自编码器神经网络和目标追踪技术,尤其涉及一种基于神经网络的图像目标跟踪算法。
背景技术
图像序列目标跟踪具有非常广泛的应用,是计算机视觉中最经典的问题之一。图像序列目标跟踪解决如下问题:在图像序列的某一帧中使用一个矩形框来界定需要被跟踪的目标对象,目标跟踪算法在后续的图像序列中给出被跟踪的目标对象在当前图像中的位置。图像目标跟踪算法在机器人技术、航天、安全监控、军事等诸多领域有着广泛的应用前景。
基于区域的目标跟踪算法把目标一开始所在的区域的矩形框作为目标对象的模板,在后序的图像序列中,使用目标对象的模板与图像中所有可能的位置进行相关度的匹配,匹配度越高说明相关性越强。基于区域的跟踪使用了目标对象的全局信息,因此可信度较高,但目标发生严重形变时容易造成跟踪失败的发生。
基于特征的目标跟踪算法使用目标的显著的特征来表示目标,比较常用的目标特征有颜色特征、灰度特征、纹理特征等,然后在新的图像上进行特征的匹配,然后根据原特征和新图像上的特征的相似性来确定目标对象的位置。
基于运动的目标跟踪算法会利用一系列图像序列中的目标的运动信息来对目标对象进行跟踪。由于二维的图像无法完整地表示三维空间中物体的运动状态,在目标对象发生复杂的运动时,这种方法通常会不稳定。
在实际的目标跟踪过程中,目标对象的外形变化和运动状态都非常复杂,当目标对象的外形和运动状态发生变化时,上述跟踪方法难以快速适应这些变化,容易造成跟踪效果差甚至跟踪失败的情况。
发明内容
本发明的目的在于克服上述现有技术的不足,采用神经网络对原图像进行编码,有效克服亮度变化以及被跟踪的目标外形变化对跟踪效果的不利影响,同时对跟踪过程进行动态调整,使得目标外形变化较快或较慢时都能得到较好的跟踪效果。
本发明的技术方案是提供一种基于神经网络的图像目标跟踪算法,包括如下:
步骤一:使用收集的图像训练自编码器,得到神经网络;
训练的目标最小化下式(1):
其中:x表示神经网络的输入,W表示网络权值,h表示隐藏层的向量;
步骤二:预处理需要跟踪的图像序列,使用自编码器进行特征提取;
步骤三:使用滤波的方法对目标进行跟踪;
步骤四:根据每一帧的跟踪结果对跟踪器进行更新;
步骤五:根据跟踪效果动态调整更新参数。
所述步骤一具体如下:
(1)、收集一系列具有明显特征的图像;
(2)、切割每个图像成多个小的图像块;
(3)、使用切割后的图像块训练自编码器;
(4)、训练出来的神经网络用于提取图像的特征向量。
所述步骤二具体如下:将输入图像分割成M×N个图像块,使用训练得到的神经网络对每个图像块进行编码,得到一组特征向量。
所述步骤三具体如下:使用窗函数过滤提取出特征,首先将经过窗函数过滤的特征向量映射到傅立叶域,使用第一帧图像的特征向量建立一个线性相关模型;对之后的每一帧图像,使用该模型预测目标对象在当前图像的位置。
所述步骤四具体如下:根据目标对象新的位置对跟踪模型的参数进行调整,以适应目标对象的外形变化。
所述步骤五具体如下:在跟踪过程中,如检测到目标对象外形变化速率较快,则提高上述步骤四中模型更新的速率,反之则降低该速率。
本发明的有益效果:
本发明有效克服亮度变化对目标对象特征的影响;实时调整跟踪模型,以适应目标对象的外形变化,得到更精确的跟踪效果;同时能够在跟踪过程中根据实际情况动态调整学习参数,使目标外形变化快慢均能取得好的跟踪效果。
本发明的算法保证了目标跟踪的准确性和鲁棒性。
附图说明
图1为本发明的算法流程图。
图2为测试序列跟踪窗口偏移图。
具体实施方式
下面通过具体实施例和附图对本发明作进一步的说明。本发明的实施例是为了更好地使本领域的技术人员更好地理解本发明,并不对本发明作任何的限制。
本发明基于神经网络的图像目标跟踪算法,如图1所示,算法包括如下步骤:步骤一、使用收集的图像训练自编码器,得到神经网络,具体:
收集一系列具有明显特征的图像,将每个图像切割成多个小的图像块,使用这些图像块对自编码器进行训练,训练的目标是最小化下式(1):
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611271054.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





