[发明专利]视频图像中基于深度学习的人脸检测方法及装置在审
申请号: | 201910078392.6 | 申请日: | 2019-01-28 |
公开(公告)号: | CN109919013A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 舒剑军 | 申请(专利权)人: | 浙江英索人工智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京鼎承知识产权代理有限公司 11551 | 代理人: | 王青伟 |
地址: | 324002 浙江省衢*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种视频图像中基于深度学习的人脸检测方法。通过不断叠加1*3和1*1卷积核,搭建轻量级特征提取网络,得到初始特征图;在初始特征图上进行连续降采样,得到多尺度特征图;通过转置卷积将低层高分辨率特征图和高层低分辨率特征图进行特征融合,提升低层特征表达能力;在不同尺度的特征图上选取不同尺寸的预测框,通过回归得出预测框与真实值之间的偏差。引入轻量级特征提取网络能够减少计算消耗,有效减少计算量,加快运算速度,提高算法实时性;适用于实时性要求较高的视频图像处理;引入连续降采样操作和转置卷积可有效应对多尺度检测和小目标检测。本发明可广泛应用于商业、安防等众多领域,实现无人自动监管,有助于提高工作效率。 | ||
搜索关键词: | 特征图 人脸检测 视频图像 特征提取 降采样 卷积 转置 视频图像处理 多尺度检测 多尺度特征 实时性要求 低层特征 低分辨率 高分辨率 工作效率 特征融合 有效减少 自动监管 引入 计算量 卷积核 实时性 小目标 预测 安防 低层 算法 叠加 运算 尺度 网络 消耗 学习 回归 检测 高层 应用 | ||
【主权项】:
1.一种视频图像中基于深度学习的人脸检测方法,其特征在于,包括以下步骤:步骤一、获取视频图像;所述视频图像的获取,包括从视频文件获取或从摄像装置实时采集获取;步骤二、通过不断叠加1*3和1*1卷积核搭建轻量级特征提取网络得到初始特征图;步骤三、在所述初始特征图上进行连续降采样,得到多尺度特征图;步骤四、通过转置卷积将低层高分辨率特征图和高层低分辨率特征图进行特征融合,提升低层特征表达能力;步骤五、在所述多尺度特征图上选取不同尺寸的所述预测框,通过回归得出所述预测框与所述真实值之间的偏差;其中,在步骤一和步骤二之间还包括步骤S1,所述步骤S1将视频图像分解为分辨率为300×300的单帧图像作为卷积神经网络的输入;所述通过不断叠加1*3和1*1卷积核搭建轻量级特征提取网络得到初始特征图包括:将所述视频图像输入所述卷积神经网络的多个通道,采用1*3卷积核分别对各个通道操作,最后从各个通道输出特征图,再由1*1卷积核对各个通道输出进行特征融合,通过迭代13次这种卷积结构,得到分辨率为38×38初始特征图。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江英索人工智能科技有限公司,未经浙江英索人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910078392.6/,转载请声明来源钻瓜专利网。