[发明专利]一种融合多层级特征的视频目标检测方法有效
申请号: | 201910948797.0 | 申请日: | 2019-10-08 |
公开(公告)号: | CN110674886B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 郭昌野;万超伦;王文 | 申请(专利权)人: | 中兴飞流信息科技有限公司 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/82;G06N3/04 |
代理公司: | 北京卫智易创专利代理事务所(普通合伙) 16015 | 代理人: | 朱春野 |
地址: | 210012 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 多层 特征 视频 目标 检测 方法 | ||
1.一种融合多层级特征的视频目标检测方法,其特征在于:具体包括以下步骤:
S1、首先通过视频图像采集模块(101)采集图像,并且将采集到的每一帧图片发送给检测模块检测;
S2、再通过多层级特征提取模块(102)将传入的视频帧进行特征提取;
S3、然后通过时序信息融合模块(103)将当前帧传入的特征与之前帧传入的特征进行融合,得到融合后的特征;
S4、之后通过目标候选输出模块(104)将含有时序信息的融合特征进行检测得到检测框;
S5、然后通过检测结果输出模块(105)将视频帧检测得到的结果进行输出;
视频目标检测方法的流程,具体实现模块如下所述:模块202与模块203:本方法会对视频的多层级特征进行提取,从而进行视频目标检测,提取视频的多层级特征即对模块201中按照时序顺序输出的视频帧,分别采用n个,不同量级的CNN进行特征提取,CNN量级的选取,一般采用一个用来提取视频帧精确特征的高精度CNN和多个不同输入维度、用来提取视频帧主旨特征的轻量级CNN;
模块204:模块204中采用ConvLSTM单元,按照时序依次接收模块202或模块203中提取的特征,ConvLSTM单元是一个有着记忆功能的循环神经网络单元,因此随着时序的增加,ConvLSTM单元可以将当前帧输入的特征,与之前帧输入的特征进行融合,得到一个包含当前帧特征与过往帧特征的融合特征,当前ConvLSTM单元将会输出一个融合了dt与dt+1的融合特征。
2.根据权利要求1所述的一种融合多层级特征的视频目标检测方法,其特征在于:其系统结构包括:视频图像采集模块(101)、多层级特征提取模块(102)、时序信息融合模块(103)、目标候选输出模块(104)和检测结果输出模块(105)。
3.根据权利要求2所述的一种融合多层级特征的视频目标检测方法,其特征在于:所述视频图像采集模块(101)从摄像头采集系统获得视频流。
4.根据权利要求3所述的一种融合多层级特征的视频目标检测方法,其特征在于:所述视频图像采集模块(101)的摄像头为模拟摄像机或数字摄像机。
5.根据权利要求2所述的一种融合多层级特征的视频目标检测方法,其特征在于:所述多层级特征提取模块(102)将视频图像采集模块(101)输出的视频流按视频帧的时序输入进特征提取器中,提取视频帧的特征。
6.根据权利要求2所述的一种融合多层级特征的视频目标检测方法,其特征在于:所述时序信息融合模块(103)将多层级特征提取模块(102)中输出的当前帧特征与时序信息融合模块(103)中存储的过往帧特征进行融合,得到融合特征。
7.根据权利要求2所述的一种融合多层级特征的视频目标检测方法,其特征在于:所述目标候选输出模块(104)将时序信息融合模块(103)输出的融合特征进行检测得到当前帧的目标检测框。
8.根据权利要求2所述的一种融合多层级特征的视频目标检测方法,其特征在于:所述检测结果输出模块(105)将目标候选输出模块(104)得到的检测框标注在视频帧上,按照时序合并视频帧,输出最终的检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴飞流信息科技有限公司,未经中兴飞流信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910948797.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种病灶匹配方法及装置
- 下一篇:一种基于视频分类的端到端道路拥堵检测算法