[发明专利]一种基于异构多分支深度卷积神经网络的监控视频人头检测方法在审

申请号：	201911168427.1	申请日：	2019-11-25
公开（公告）号：	CN111144209A	公开（公告）日：	2020-05-12
发明（设计）人：	王慧燕;潘峥昊	申请（专利权）人：	浙江工商大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/32;G06N3/04
代理公司：	浙江杭州金通专利事务所有限公司 33100	代理人：	许可唯
地址：	310018 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于异构多分支深度卷积神经网络监控视频人头检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于异构多分支深度卷积神经网络的监控视频人头检测方法，其特征在于包括如下步骤：

S1）数据增强

使用Mixup方法对人头检测数据进行数据增强操作，使用线性插值的方法构建新的训练样本和标签来代替原样本和标签；

S2）人头部位检测

S2-1）构建卷积神经网络Dense_YOLO

修改YOLOv3主干网络结构为双分支结构，其中一个分支以DenseNet121网络作为主干网络，去掉其最后一层FC层，另一个分支以Darknet53作为主干网络，去掉其最后一层FC层；将DenseNet121的基础结构由CBL结构修改为BRC结构，而Darknet53分支的BRC结构不作修改；

S2-2）特征图层次选择与融合

利用S2-1）中的双主干网络对增强后的训练数据进行训练；

将两个主干网络获得的特征图进行融合，得到三层特征图，对应的输入通道数分别为256、512和1024；

对最后一层特征图进行如下操作：首先，将它放进make embedding层中，通过后面的5层CBL结构后通道数减少一半；然后，分成两条路径，一条路径通过3×3卷积升维到原先的维度，再通过一个1×1卷积得到最终的255维输出，另一条路径通过1×1卷积通道数降维至一半，再通过上采样层得到特征图和主干网络输入的下一层次特征图进行拼接；

以此类推，得到第二层、第三层的输出；这三个层次的输出共同构成最终的输出结果；

S2-3）行人头部目标框预测

从S2-2）得到的三个特征图分别通过µ×（4+1+c）个1×1卷积进行卷积预测，其中µ为预设边界框的数量，c为待预测的目标类别数；

预设边界框的尺寸可根据训练数据集通过聚类得到，根据网络预测得到的目标边框内包含目标的概率和目标框中心点偏移量以及宽和高，最终得到目标真实的边界框，实现对目标的准确定位。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工商大学，未经浙江工商大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911168427.1/1.html，转载请声明来源钻瓜专利网。

上一篇：一种检查检验预约系统
下一篇：一种应用于云服务的共享边缘计算系统及其使用方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于异构多分支深度卷积神经网络的监控视频人头检测方法在审

专利文献下载