[发明专利]一种基于异构多分支深度卷积神经网络的监控视频人头检测方法在审

专利信息
申请号: 201911168427.1 申请日: 2019-11-25
公开(公告)号: CN111144209A 公开(公告)日: 2020-05-12
发明(设计)人: 王慧燕;潘峥昊 申请(专利权)人: 浙江工商大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/32;G06N3/04
代理公司: 浙江杭州金通专利事务所有限公司 33100 代理人: 许可唯
地址: 310018 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 异构多 分支 深度 卷积 神经网络 监控 视频 人头 检测 方法
【权利要求书】:

1.一种基于异构多分支深度卷积神经网络的监控视频人头检测方法,其特征在于包括如下步骤:

S1)数据增强

使用Mixup方法对人头检测数据进行数据增强操作,使用线性插值的方法构建新的训练样本和标签来代替原样本和标签;

S2)人头部位检测

S2-1)构建卷积神经网络Dense_YOLO

修改YOLOv3主干网络结构为双分支结构,其中一个分支以DenseNet121网络作为主干网络,去掉其最后一层FC层,另一个分支以Darknet53作为主干网络,去掉其最后一层FC层;将DenseNet121的基础结构由CBL结构修改为BRC结构,而Darknet53分支的BRC结构不作修改;

S2-2)特征图层次选择与融合

利用S2-1)中的双主干网络对增强后的训练数据进行训练;

将两个主干网络获得的特征图进行融合,得到三层特征图,对应的输入通道数分别为256、512和1024;

对最后一层特征图进行如下操作:首先,将它放进make embedding层中,通过后面的5层CBL结构后通道数减少一半;然后,分成两条路径,一条路径通过3×3卷积升维到原先的维度,再通过一个1×1卷积得到最终的255维输出,另一条路径通过1×1卷积通道数降维至一半,再通过上采样层得到特征图和主干网络输入的下一层次特征图进行拼接;

以此类推,得到第二层、第三层的输出;这三个层次的输出共同构成最终的输出结果;

S2-3)行人头部目标框预测

从S2-2)得到的三个特征图分别通过µ×(4+1+c)个1×1卷积进行卷积预测,其中µ为预设边界框的数量,c为待预测的目标类别数;

预设边界框的尺寸可根据训练数据集通过聚类得到,根据网络预测得到的目标边框内包含目标的概率和目标框中心点偏移量以及宽和高,最终得到目标真实的边界框,实现对目标的准确定位。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911168427.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top