[发明专利]一种基于卷积神经网络的水平集目标追踪方法在审
申请号: | 201710951863.0 | 申请日: | 2017-10-13 |
公开(公告)号: | CN107705323A | 公开(公告)日: | 2018-02-16 |
发明(设计)人: | 刘利雄;宁小东 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246 |
代理公司: | 北京理工正阳知识产权代理事务所(普通合伙)11639 | 代理人: | 鲍文娟 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 水平 目标 追踪 方法 | ||
技术领域
本发明涉及一种基于卷积神经网络的水平集目标追踪方法,属于目标追踪和视频处理技术领域。
背景技术
目标追踪是一项应用广泛的技术。在计算机视频处理领域中,目标追踪问题一般是指,给定视频序列中第一帧的物体位置或轮廓信息,计算后续每一帧中,该物体的位置或轮廓。由于视频序列中的物体存在形变、遮挡和尺度变换等问题,目标追踪仍然是一个具有挑战性的问题。为了解决这一问题,TLD(Tracking-learning-detection)算法将追踪和检测(Detection)相结合,奠定了利用检测进行追踪(Tracking by Detection)算法的基础。目前较为高效的算法普遍在这一框架下展开,它们主要由检测和追踪两个模块构成:检测模块负责在不同光照、背景等条件下判定物体是否出现;追踪模块负责在物体出现的范围内,确定物体的具体位置、大小或者轮廓。
特征(Features)是检测准确性的关键。已有的追踪算法大部分只利用了视频帧的一般特征(Hand-crafted Features),而不利用深度学习特征(Deep Features),导致检测准确性不足。针对这一问题,应使用卷积神经网络(CNN,Convolutional Neural Network)提取视频帧的深度特征,利用其中包含的语义信息(Semantical Information),以便弥补一般特征的缺陷。
追踪模块的算法则决定了目标追踪的效率和质量。较高效的轮廓追踪算法有:GrabCut,水平集法(Level Set Method)等。相较于其他算法,水平集法具有快速、鲁棒的特点,能够实时地完成目标追踪的任务,有效提高整个目标追踪方法的运行速度。
与本发明相关的文章和专利有以下4篇,下文将分别对其进行分析:
文章(1):2011年IEEE International Conference on Computer Vision(ICCV),题目为:“Hough-based tracking of non-rigid objects”,通过霍夫森林获取物体中心和其支持点(Support),以此为基础初始化GrabCut算法提取追踪目标的轮廓。该算法能够追踪每一帧的目标轮廓,然而运行速度较低,检测模块所利用的特征皆为较低层次的一般特征,检测能力较低;
文章(2):《IEEE Transactions on Image Processing》2015年24卷11期,题目为:“Non-rigid object contour tracking via a novel supervised level set model”,利用了水平集法作为追踪模块,能够高效提取视频帧中的目标轮廓。但是该算法在检测模块利用了单一的一般特征及Adaboost分类算法,准确性不足,而且水平集能量函数(Energy Function)缺乏对视频帧信息和检测模块输出信息的平衡,容易造成能量函数迭代错误,目标丢失;
文章(3):2015年IEEE International Conference on Computer Vision(ICCV),题目为:“Visual tracking with fully convolutional networks”,通过一种名为“VGG net”的卷积神经网络的conv4-3和conv5-3层提取特征,构造全局和局部神经网络进行目标追踪。该方法利用了conv4和conv5层次的两个卷积层(Convolutional Layers)提取特征,尽管在追踪上取得了一定效果,但是仅两个卷积层提供的信息有所不足;
专利(1):申请号201710053918.6,标题为“一种基于深度学习的多目标追踪系统及实现方法”,通过目标检测获得第一帧目标位置,将多个待追踪目标加入队列,并在下一帧中遍历该队列,获取所有目标的位置。该系统能够获取追踪目标的追踪框,但是仅仅得到了目标的位置和大小,不能获取目标的具体轮廓。
上述已有的追踪算法一定程度上完成了目标追踪的任务,然而,它们在目标检测、轮廓提取的效率和准确性上都具有不足。本发明旨在解决现有目标追踪算法对于视频帧深度学习特征不敏感、追踪模块算法效率低的问题,提出了一种可用于长期追踪的、较高效的基于卷积神经网络和水平集模型的目标追踪方法。
发明内容
本发明的目的是为了解决现有追踪方法对于目标轮廓追踪的不足,提出了一种基于卷积神经网络的水平集目标追踪方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710951863.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:移位寄存器单元及其驱动方法、阵列基板和显示装置
- 下一篇:一种栅极驱动电路