[发明专利]一种视频流实时行人检测方法在审
申请号: | 201910859779.5 | 申请日: | 2019-09-11 |
公开(公告)号: | CN110555425A | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 张春月;史小宏;易典;徐浩 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 31323 上海元好知识产权代理有限公司 | 代理人: | 张妍;周乃鑫 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 分类概率 边界框 二值化 卷积 分类误差 检测结果 快速检测 损失函数 特征提取 行人检测 坐标误差 不敏感 计算量 可信度 视频流 回归 检测 准确率 低维 尺度 输出 融合 | ||
1.一种视频流实时行人检测方法,其特征在于,包含以下步骤:
步骤S1、对卷积神经网络的输入和权值进行二值化,使用卷积神经网络提取行人的卷积特征;
步骤S2、融合卷积神经征,输出不同尺度的回归边界和分类概率;
步骤S3、根据回归边界和分类概率,使用包含了分类误差、边界框坐标误差和边界框内目标可信度误差的损失函数对二值化后的卷积神经网络进行训练,得到最终的检测结果。
2.如权利要求1所述的视频流实时行人检测方法,其特征在于,所述的卷积神经网络包含5类残差块,每类残差块跨2层连接,每类残差块包含2个卷积层和一个短连接,每类的数量分别为:1,2,8,8,4,最后输出1024维8×8的卷积特征。
3.如权利要求2所述的视频流实时行人检测方法,其特征在于,所述的对卷积神经网络的输入和权值进行二值化的方法包含以下步骤:
步骤S1-1、卷积神经网络权值二值化;
引入标量参数α,使得W≈α×B,其中,W为原始权值,B为二值化的权值,B=sign(W),表示对原始权值进行L1归一化之后除n;
步骤S1-2、卷积神经网络输入二值化;
将输入在通道维度计算归一化得到A,用w×h大小的卷积核k对A进行卷积得到K,k=1/wh,之后只需要将Sign(I)与Sign(W)进行卷积,再乘K和α即可;
步骤S1-3、使用来替代二值化时的梯度计算。
4.如权利要求3所述的视频流实时行人检测方法,其特征在于,所述的步骤S2具体包含以下步骤:
步骤S2.1、将卷积神经网络中最后一层的输出卷积特征进行softmax回归,得到第一个回归边界和分类概率,作为第一个融合尺度特征;
步骤S2.2、将来自卷积神经网络中倒数第1类残差块的最后一组的卷积特征与卷积神经网络的最后一层的输出卷积特征进行2倍上采样融合,然后进行4次卷积后,得到第二个回归边界和分类概率,作为第二个融合尺度特征;
步骤S2.3、将来自卷积神经网络中倒数第2类残差块的最后一组的卷积特征与第二个融合尺度特征进行2倍上采样的融合,然后进行4次卷积后,得到第三个回归边界和分类概率,作为第三个融合尺度特征。
5.如权利要求4所述的视频流实时行人检测方法,其特征在于,步骤S3中,所述的损失函数L为:
其中,为边界框坐标误差损失函数,λcoord为坐标惩罚参数,表示单位格i,边界框j中是否有目标存在,S为划分的单元格数目,x,y,w,h分别为边界框的中心坐标以及宽高,为边界框内目标可信度误差损失函数,c为该单元格出现目标概率,为分类误差,p为单元格内每种类别的概率,表示是否有目标中心点落在单元格i上,classes为训练中的种类参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910859779.5/1.html,转载请声明来源钻瓜专利网。