[发明专利]基于双信息流与视网膜感受野结构的行人检测模型设计方法在审
| 申请号: | 201911255983.2 | 申请日: | 2019-12-10 |
| 公开(公告)号: | CN111241910A | 公开(公告)日: | 2020-06-05 |
| 发明(设计)人: | 候少麒;殷光强;李耶;刘学婷;杨晓宇;黄方正 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 成都天嘉专利事务所(普通合伙) 51211 | 代理人: | 康拯通 |
| 地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 信息 视网膜 感受 结构 行人 检测 模型 设计 方法 | ||
本发明属于计算机视觉技术领域,公开了一种基于双信息流结构与视网膜感受野结构的快速行人检测网络设计方法。包括Conv1卷积单元构建步骤、TIFB双信息流模块构建步骤、RRFB视网膜感受野单元构建步骤、特征图处理卷积构建步骤和多尺度行人检测构建步骤,是一种变尺度单阶段的快速行人检测算法网络的结构设计,其所含卷积层较少,推理过程只需要对输入图片进行一次前向运算,有效地兼顾了行人检测中的精度和速度问题。
技术领域
本发明属于计算机视觉技术领域,具体涉及一种基于双信息流结构与视网膜感受野结构的快速行人检测网络设计方法。
背景技术
行人检测是行人识别或再识别的第一步关键环节,是指对于任意一幅给定的图像,利用行人视觉特征信息对其进行搜索以确定其中是否含有行人,并返回行人的位置、大小和姿态的生物技术。
现今的行人检测技术主要分为传统算法和深度学习算法两大类。传统算法主要使用基于几何特征、模板匹配、统计分析等方法,依赖手动提取的Haar、HOG等特征描述子进行行人检测,最大的缺陷是手工特征提取速度慢、表征能力差且不具有良好的泛化能力,难以应对行人尺度差异、光照变化、遮挡等条件带来的影响;随着神经网络的发展,深度学习技术以其特征的高效性与鲁棒性、处理速度的实时性等优势逐渐成为行人检测的主流方法。深度学习是一种自主特征提取的、端到端的学习方法,其学习流程简单,大大减少了时间成本。
深度学习算法使得行人检测的精度取得了长足的进步,在世界权威基准数据集上的真正例率(简称TPR)已逐渐趋于饱和。但在精度提高的同时,行人检测算法的推理时间长、检测速度低却依然是其所面临又一重大挑战,更深的神经网络具有更多的参数,一般也会具有更强的表达能力。然而,由于优化神经网络需要借助反向传播算法,随着层数增多,神经网络容易发生梯度消失或者梯度爆炸,这导致深度神经网络难以训练、不容易收敛,从而导致网络性能退化,行人检测精度和速度的兼顾性亟待解决。
VJ检测算法和基于DPM的传统行人检测算法使用人工设计的描述子,检测速度可以达到实时,但由于人工设计的描述子数量少,自适应能力差,检测的效果却很一般;Faster-RCNN、CMS-RCNN、HR、SSH等基于卷积神经网络的两阶段或单阶段算法,借助深层卷积网络强大的表征能力,达到了很好的检测效果,但是由于基础卷积网络层数过多,计算量和推理时间迅速增加,检测速度变得缓慢;MTCNN是多阶段行人检测算法中的代表算法,具有较高的TPR,检测速度完全可以达到实时,但是却存在多阶段行人检测算法固有的缺陷——提取大量重复计算的候选框。
发明内容
本发明提供了一种变尺度单阶段的快速行人检测算法网络的结构设计,其所含卷积层较少,推理过程只需要对输入图片进行一次前向运算,有效地兼顾了行人检测中的精度和速度问题。
本发明所公开的基于双信息流与视网膜感受野结构的行人检测模型设计方法,其特征在于,包括以下步骤:
Conv1卷积单元构建步骤,构建包括用于提取特征的卷积层、用于对数据分布进行归一化的BN层和用于增加特征的非线性表达的激活层的Conv1卷积单元;这三层是深度学习的通用层,优选地,卷积层为7*7卷积层,使用较大的卷积核和滑动步长,以及较小的通道数,便于迅速减少特征图的尺寸以及后续步骤的计算量。
TIFB双信息流模块构建步骤,TIFB双信息流模块包括三个依次串联的TIFB基本单元,所述TIFB基本单元包括顺序相连的卷积层、BN层和激活层;待检测的图像经过所述Conv1卷积单元的处理后输入至TIFB双信息流模块,依次经过TIFB基本单元的卷积层、BN层、激活层等操作组成的映射函数F(x)输出,将输出的映射函数F(x)与所述Conv1卷积模块的输入(即x项)进行逐元素、逐通道相加后得到最终的输出特征图y;这一跨层结构的目的是改变网络对原始映射的学习方式,可以防止在深层网络模型中出现梯度消失或梯度爆炸的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911255983.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于融合时空特征的深度网络的交通流预测方法
- 下一篇:一种信息存储器
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





