[发明专利]一种视频中目标对象的检测跟踪方法、装置及设备有效
申请号: | 201711455858.7 | 申请日: | 2017-12-28 |
公开(公告)号: | CN108320296B | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 谯帅;彭莉;刘洋 | 申请(专利权)人: | 新智数字科技有限公司 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06N3/04 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 杨移;万铁占 |
地址: | 065000 河北省廊坊市经济*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 目标 对象 检测 跟踪 方法 装置 设备 | ||
本申请公开了一种视频中目标对象的检测跟踪方法、装置及设备,其中,方法具体包括,将连续视频帧输入至预先训练得到的卷积神经网络中;其中,所述卷积神经网络至少包括设定数量的共享卷积层,区域建议网络层,利用所述共享卷积层提取连续视频帧的特征,得到分别对应于不同视频帧的特征映射图,利用所述区域建议网络层,根据所述特征映射图确定与目标对象相关的目标区域,基于所述目标区域,检测目标对象在连续视频帧中的位置及运行轨迹。通过该方法,采用卷积神经网络模型将检测跟踪统一起来,减少计算量,并可以解决目标多姿态多视角的检测难题,提升目标检出率,降低误检率。
技术领域
本申请涉及机器视觉技术领域,尤其涉及一种视频中目标对象的检测跟踪方法、装置及设备。
背景技术
目前,对视频中动态目标对象(如:视频中的车辆、行人等)的检测识别技术,广泛应用于交通、安全监控、家庭娱乐等多个领域。
现有技术中,为了提取视频中的动态目标对象,通常采用背景建模与前景检测(Background Generation And Foreground Detection)的方法,获取运动前景,从而得到相关的目标对象。
然而,现有技术中的上述方法受光照等环境因素的影响较大,可能造成较多误检,并且对静止的目标可能漏检。
发明内容
本说明书实施例提供一种视频中目标对象的检测跟踪方法、装置及设备,以通过神经网络模型实现对连续视频帧中目标对象的检测及跟踪。
本说明书实施例提供的一种视频中目标对象的检测跟踪方法,具体包括:
将连续视频帧输入至预先训练得到的卷积神经网络中;其中,所述卷积神经网络至少包括设定数量的共享卷积层,区域建议网络层;
利用所述共享卷积层提取连续视频帧的特征,得到分别对应于不同视频帧的特征映射图;
利用所述区域建议网络层,根据所述特征映射图确定与目标对象相关的目标区域;
基于所述目标区域,检测目标对象在连续视频帧中的位置及运行轨迹。
此外,本实施例还提供了一种视频中目标对象的检测跟踪装置,具体包括:
输入模块,将连续视频帧输入至预先训练得到的卷积神经网络中;其中,所述卷积神经网络至少包括设定数量的共享卷积层,区域建议网络层;
特征提取模块,利用所述共享卷积层提取连续视频帧的特征,得到分别对应于不同视频帧的特征映射图;
区域确定模块,利用所述区域建议网络层,根据所述特征映射图确定与目标对象相关的目标区域;
检测跟踪模块,基于所述目标区域,检测目标对象在连续视频帧中的位置及运行轨迹。
此外,本实施例还提供了一种视频中目标对象的检测跟踪设备,具体包括:
存储器,存储视频中目标对象的检测跟踪程序;
通讯接口,接收视频帧;
处理器,在通讯接口接收到视频帧后,调用存储器中存储的视频中目标对象的检测跟踪程序,并执行:
将连续视频帧输入至预先训练得到的卷积神经网络中;其中,所述卷积神经网络至少包括设定数量的共享卷积层,区域建议网络层;
利用所述共享卷积层提取连续视频帧的特征,得到分别对应于不同视频帧的特征映射图;
利用所述区域建议网络层,根据所述特征映射图确定与目标对象相关的目标区域;
基于所述目标区域,检测目标对象在连续视频帧中的位置及运行轨迹。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新智数字科技有限公司,未经新智数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711455858.7/2.html,转载请声明来源钻瓜专利网。