[发明专利]一种视频流实时行人检测方法在审

申请号：	201910859779.5	申请日：	2019-09-11
公开（公告）号：	CN110555425A	公开（公告）日：	2019-12-10
发明（设计）人：	张春月;史小宏;易典;徐浩	申请（专利权）人：	上海海事大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司：	31323 上海元好知识产权代理有限公司	代理人：	张妍;周乃鑫
地址：	201306 上海市***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	卷积神经网络分类概率边界框二值化卷积分类误差检测结果快速检测损失函数特征提取行人检测坐标误差不敏感计算量可信度视频流回归检测准确率低维尺度输出融合
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种视频流实时行人检测方法，其特征在于，包含以下步骤：

步骤S1、对卷积神经网络的输入和权值进行二值化，使用卷积神经网络提取行人的卷积特征；

步骤S2、融合卷积神经征，输出不同尺度的回归边界和分类概率；

步骤S3、根据回归边界和分类概率，使用包含了分类误差、边界框坐标误差和边界框内目标可信度误差的损失函数对二值化后的卷积神经网络进行训练，得到最终的检测结果。

2.如权利要求1所述的视频流实时行人检测方法，其特征在于，所述的卷积神经网络包含5类残差块，每类残差块跨2层连接，每类残差块包含2个卷积层和一个短连接，每类的数量分别为：1，2，8，8，4，最后输出1024维8×8的卷积特征。

3.如权利要求2所述的视频流实时行人检测方法，其特征在于，所述的对卷积神经网络的输入和权值进行二值化的方法包含以下步骤：

步骤S1-1、卷积神经网络权值二值化；

引入标量参数α，使得W≈α×B，其中，W为原始权值，B为二值化的权值，B＝sign(W)，表示对原始权值进行L1归一化之后除n；

步骤S1-2、卷积神经网络输入二值化；

将输入在通道维度计算归一化得到A，用w×h大小的卷积核k对A进行卷积得到K，k＝1/wh，之后只需要将Sign(I)与Sign(W)进行卷积，再乘K和α即可；

步骤S1-3、使用来替代二值化时的梯度计算。

4.如权利要求3所述的视频流实时行人检测方法，其特征在于，所述的步骤S2具体包含以下步骤：

步骤S2.1、将卷积神经网络中最后一层的输出卷积特征进行softmax回归，得到第一个回归边界和分类概率，作为第一个融合尺度特征；

步骤S2.2、将来自卷积神经网络中倒数第1类残差块的最后一组的卷积特征与卷积神经网络的最后一层的输出卷积特征进行2倍上采样融合，然后进行4次卷积后，得到第二个回归边界和分类概率，作为第二个融合尺度特征；

步骤S2.3、将来自卷积神经网络中倒数第2类残差块的最后一组的卷积特征与第二个融合尺度特征进行2倍上采样的融合，然后进行4次卷积后，得到第三个回归边界和分类概率，作为第三个融合尺度特征。

5.如权利要求4所述的视频流实时行人检测方法，其特征在于，步骤S3中，所述的损失函数L为：

其中，为边界框坐标误差损失函数，λ_coord为坐标惩罚参数，表示单位格i，边界框j中是否有目标存在，S为划分的单元格数目，x，y，w，h分别为边界框的中心坐标以及宽高，为边界框内目标可信度误差损失函数，c为该单元格出现目标概率，为分类误差，p为单元格内每种类别的概率，表示是否有目标中心点落在单元格i上，classes为训练中的种类参数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海海事大学，未经上海海事大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910859779.5/1.html，转载请声明来源钻瓜专利网。

上一篇：港口集装箱布局检测方法、装置、设备及可读存储介质
下一篇：视线检测方法、装置、设备及存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种视频流实时行人检测方法在审

专利文献下载