[发明专利]行人检测方法和装置有效
申请号: | 201611205712.2 | 申请日: | 2016-12-23 |
公开(公告)号: | CN106845352B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 俞刚;彭超 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/08 |
代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亚南 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人 检测 方法 装置 | ||
本发明的实施例提供了一种行人检测方法和装置。该行人检测方法包括:获取待处理图像;分析待处理图像的每个像素所属场景的场景信息;以及结合待处理图像的每个像素所属场景的场景信息检测待处理图像中的行人,以确定待处理图像中的行人所在的位置。上述行人检测方法和装置结合图像中的场景信息来进行行人检测,通过使用场景信息可以有效地减少行人检测算法所产生的假阳性结果,同时利用场景信息可以帮助行人检测算法提高检测精度。
技术领域
本发明涉及计算机领域,更具体地涉及一种行人检测方法和装置。
背景技术
在监控领域,行人检测具有非常重要的作用。目前的行人检测算法往往通过滑窗(sliding-window)方法来从待处理图像上提取多种不同尺度的窗口(每个窗口是一个矩形框,也可以称为行人框),并判断每个窗口中是否存在行人。但是这样的方法往往没有考虑场景的上下文(context)信息,依靠单一窗口判断是否有行人可能会得到很多假阳性(false positive)的检测结果。例如,场景中的树木、建筑物等物体可能跟行人的外观很像,这样就有可能发生误检测。
发明内容
考虑到上述问题而提出了本发明。本发明提供了一种行人检测方法和装置。
根据本发明一方面,提供了一种行人检测方法。该方法包括:获取待处理图像;分析待处理图像的每个像素所属场景的场景信息;以及结合待处理图像的每个像素所属场景的场景信息检测待处理图像中的行人,以确定待处理图像中的行人所在的位置。
示例性地,在分析待处理图像的每个像素所属场景的场景信息之前,行人检测方法还包括:提取待处理图像的特征;分析待处理图像的每个像素所属场景的场景信息包括:基于待处理图像的特征分析待处理图像的每个像素所属场景的场景信息;结合待处理图像的每个像素所属场景的场景信息检测待处理图像中的行人包括:结合待处理图像的特征和待处理图像的每个像素所属场景的场景信息检测待处理图像中的行人,以确定待处理图像中的行人所在的位置。
示例性地,基于待处理图像的特征分析待处理图像的每个像素所属场景的场景信息包括:将待处理图像的特征输入全卷积网络,以获得与预定数目的场景类别一一对应的预定数目的场景特征图,其中,每个场景特征图与待处理图像大小一致,并且每个场景特征图的每个像素的像素值表示待处理图像的、与该像素位置一致的像素属于该场景特征图所对应的场景类别的场景置信度。
示例性地,在将待处理图像的特征输入全卷积网络,以获得与预定数目的场景类别一一对应的预定数目的场景特征图之后,行人检测方法还包括:对于待处理图像的每个像素,从预定数目的场景特征图的、与该像素位置一致的像素的像素值中选择像素值最大的像素;以及对于待处理图像的每个像素,确定该像素属于像素值最大的像素所属的场景特征图所对应的场景类别。
示例性地,提取待处理图像的特征包括:将待处理图像输入卷积神经网络,以获得至少一个图像特征图,其中,至少一个图像特征图代表待处理图像的特征。
示例性地,结合待处理图像的特征和待处理图像的每个像素所属场景的场景信息检测待处理图像中的行人包括:利用一个或多个卷积层对至少一个图像特征图和预定数目的场景特征图进行卷积,以获得行人特征图,其中,行人特征图与待处理图像大小一致,并且行人特征图的每个像素的像素值包括基于待处理图像的、与该像素位置一致的像素预测出的行人框的顶点坐标和该行人框属于行人的行人置信度。
示例性地,利用一个或多个卷积层对至少一个图像特征图和预定数目的场景特征图进行卷积包括:对至少一个图像特征图和预定数目的场景特征图进行拼接;以及将拼接后的特征图输入一个或多个卷积层中的在先卷积层,以由一个或多个卷积层处理。
示例性地,结合待处理图像的特征和待处理图像的每个像素所属场景的场景信息检测待处理图像中的行人还包括:对包含同一行人的多个行人框进行筛选,以保留包含同一行人的行人框之一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611205712.2/2.html,转载请声明来源钻瓜专利网。