[发明专利]一种基于异构多分支深度卷积神经网络的监控视频人头检测方法在审
申请号: | 201911168427.1 | 申请日: | 2019-11-25 |
公开(公告)号: | CN111144209A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 王慧燕;潘峥昊 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06N3/04 |
代理公司: | 浙江杭州金通专利事务所有限公司 33100 | 代理人: | 许可唯 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 异构多 分支 深度 卷积 神经网络 监控 视频 人头 检测 方法 | ||
1.一种基于异构多分支深度卷积神经网络的监控视频人头检测方法,其特征在于包括如下步骤:
S1)数据增强
使用Mixup方法对人头检测数据进行数据增强操作,使用线性插值的方法构建新的训练样本和标签来代替原样本和标签;
S2)人头部位检测
S2-1)构建卷积神经网络Dense_YOLO
修改YOLOv3主干网络结构为双分支结构,其中一个分支以DenseNet121网络作为主干网络,去掉其最后一层FC层,另一个分支以Darknet53作为主干网络,去掉其最后一层FC层;将DenseNet121的基础结构由CBL结构修改为BRC结构,而Darknet53分支的BRC结构不作修改;
S2-2)特征图层次选择与融合
利用S2-1)中的双主干网络对增强后的训练数据进行训练;
将两个主干网络获得的特征图进行融合,得到三层特征图,对应的输入通道数分别为256、512和1024;
对最后一层特征图进行如下操作:首先,将它放进make embedding层中,通过后面的5层CBL结构后通道数减少一半;然后,分成两条路径,一条路径通过3×3卷积升维到原先的维度,再通过一个1×1卷积得到最终的255维输出,另一条路径通过1×1卷积通道数降维至一半,再通过上采样层得到特征图和主干网络输入的下一层次特征图进行拼接;
以此类推,得到第二层、第三层的输出;这三个层次的输出共同构成最终的输出结果;
S2-3)行人头部目标框预测
从S2-2)得到的三个特征图分别通过µ×(4+1+c)个1×1卷积进行卷积预测,其中µ为预设边界框的数量,c为待预测的目标类别数;
预设边界框的尺寸可根据训练数据集通过聚类得到,根据网络预测得到的目标边框内包含目标的概率和目标框中心点偏移量以及宽和高,最终得到目标真实的边界框,实现对目标的准确定位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911168427.1/1.html,转载请声明来源钻瓜专利网。