[发明专利]一种监控场景下融合上下文信息的行人位置检测方法在审
申请号: | 201710554767.2 | 申请日: | 2017-07-07 |
公开(公告)号: | CN107273870A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 郭荣幸;李涛;马鹏阁;李冬梅;朱晓珺;汪伟;张栋梁;曲豪;邹香玲;郭航宇;高大伟;刘永 | 申请(专利权)人: | 郑州航空工业管理学院;郑州禅图智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 郑州联科专利事务所(普通合伙)41104 | 代理人: | 刘建芳 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监控 场景 融合 上下文 信息 行人 位置 检测 方法 | ||
1.一种监控场景下融合上下文信息的行人位置检测方法,其特征在于,包括以下步骤:
步骤A:提取输入图像的卷积神经网络特征;
步骤B:将监控场景的上下文信息融入到卷积神经网络中,生成关于行人位置的掩码图z;
步骤C:对掩码图z进行后处理,估计包含行人位置的边界框。
2.根据权利要求1所述的一种监控场景下融合上下文信息的行人位置检测方法,其特征在于:所述的步骤A包括以下步骤:
步骤A1:定义输入图像为x0,将其表示为其中,和分别表示图像x0在RGB空间的三通道图;则第l个卷积层的第j个特征图计算方式如下:
其中,l表示卷积层的索引,l=1,2,3,4,5;Ml表示第l个卷积层特征图的数目,M1=96、M2=256、M3=384、M4=384、M5=256;表示相邻卷积层特征图的连接关系;表示卷积操作;与分别表示卷积核和偏移;
步骤A2:第l个卷积层的第j个特征图通过第l个卷积层的池化层和非线性层得到输入图像x0在第l个卷积层获取的j张特征图其中,j=1,...,256;
输入图像x0在第l个卷积层获取的j张特征图表示为:
其中,g(·)表示对进行局部响应归一化处理,f(·)表示激活函数,f(·)采用不饱和非线性函数:
因此,卷积神经网络对输入图像x0在第五个卷积层获取了256张特征图
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州航空工业管理学院;郑州禅图智能科技有限公司,未经郑州航空工业管理学院;郑州禅图智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710554767.2/1.html,转载请声明来源钻瓜专利网。