[发明专利]基于场景复杂度的行人检测方法与系统有效

专利信息
申请号: 201811006043.5 申请日: 2018-08-30
公开(公告)号: CN109034125B 公开(公告)日: 2021-12-03
发明(设计)人: 张文利;杨堃;郭向 申请(专利权)人: 北京工业大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/46;G06K9/62
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 沈波
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了基于场景复杂度的行人检测方法与系统,方法包括数据读取、图像预处理、基于场景复杂度自动调整DPM行人检测阈值以及行人检测组成。通过计算所述的场景复杂度得到最适合此场景的行人检测阈值。随后将待检测图片与计算得到的行人检测阈值输入至DPM算法对行人进行检测,DPM算法将输出检测结果以及检测得分,通过设定行人检测阈值可以将检测得分较低的非行人目标区分剔除,提高检测结果的准确程度。本方法可适应多种监控场景,不再需要使用者根据场景手动调整行人检测阈值,并且计算方式相对简单,不会大幅增加检测算法的复杂度,减轻监控系统需要承担的计算量。本发明提出的行人检测方法使用相对简便,具有良好的检测结果。
搜索关键词: 基于 场景 复杂度 行人 检测 方法 系统
【主权项】:
1.基于场景复杂度的行人检测方法,其特征在于:包括以下步骤:步骤1,读取待检测数据;从摄像装置或存储设备中读取得到待检测数据,判断待检测数据类型并根据其数据类型使用不同的方法将得到的待检测数据以图像形式保存在计算机存储设备中;保存得到的待检测图像将作为步骤2以及步骤4的输入;读取待检测数据的步骤如下:步骤1.1,读取摄像装置或存储设备中的待检测数据,判断待检测数据类型;若待检测数据类型为视频类型,则进行步骤1.2;若待检测数据类型为图像类型,则进行步骤1.3;步骤1.2,若待检测数据为视频数据,对视频数据进行分帧处理,将视频数据转换为图像数据,将转化后得到的图像数据保存在计算机或存储设备中;步骤1.3,若待检测数据为图像数据,将读取得到的图像数据保存在计算机或存储设备中;步骤2,待检测图像预处理;将步骤1中保存的待检测图像数据作为输入,根据选取的场景复杂度计算方式对待检测图像进行预处理;场景复杂度计算方式中,首先转化待检测图像的像素值类型,并将待检测图像转化为灰度图像;然后提取灰度图像边缘信息并将其转化为二值化图像;该二值化图像将作为步骤3的输入,待检测图像预处理的步骤如下:步骤2.1,将待检测图像的像素值从整数即int类型转化为小数即double类型,并将待检测图像转化为灰度图像;分别提取待检测图像RGB三通道像素值,然后通过公式Fgray=0.2989*R+0.5870*G+0.1140*B计算灰度图像每一个像素点的灰度像素值;步骤2.2,将步骤2.1中转化的灰度图像作为输入,提取该灰度图像的边缘信息并将其转化为二值化图像;将图像的每一个点都用sobel算子做卷积,得到该点灰度数值后与matlab软件中edge函数计算的自适应阈值比较,若该点灰度大小高于阈值,设定该点像素值为255即白色;若该点灰度大小小于阈值,设定该点像素值为0即黑色,在所有灰度数值与阈值比较后输出二值化图像;步骤3,计算待检测图像的场景复杂度;将步骤2输出的二值化图像作为输入,根据该二值化图像以及场景复杂度计算方式计算得到待检测图像场景复杂度,并根据待检测图像场景复杂度设置行人检测阈值,设置的行人检测阈值将作为步骤4的输入,计算待检测图像的场景复杂度的步骤如下:步骤3.1,遍历步骤S20输出的二值化图像,统计整幅图像中的白色像素个数W以及总像素个数All来计算场景复杂度;步骤3.2,根据步骤3.1得到的场景复杂度GC设置行人检测阈值;步骤4,使用DPM算法对行人进行检测;将步骤1中保存的待检测图像数据以及步骤3中设置的行人检测阈值作为输入,将上述待检测图像数据以及设置的行人检测阈值输入至DPM算法中进行行人检测,使用DPM算法对行人进行检测的步骤如下:步骤4.1,读取DPM行人模型;训练模型时,设定部件模型个数为8,使用INRIA行人样本库进行训练;最终得到1个行人根滤波器以及8个行人部件滤波器;步骤4.2,提取改进的HOG图像特征;首先,只提取无符号的HOG特征,将会产生4*9=36维特征,分别将每一行特征相加,并且分别将每一列特征相加,得到4+9=13个特征向量,然后提取有符号的HOG特征,将会产生4*18=72维特征,分别将每一列特征相加,得到18个特征向量,一共产生13+18=31个梯度向量,改进的HOG特征由上述31个梯度向量构成;步骤4.3,在待检测图像上设置并滑动检测窗口,与步骤4.1读取的DPM行人模型即共9个滤波器进行匹配,得到9个滤波器响应值;步骤4.4,综合步骤4.3得到的9个滤波器响应值,计算得到检测窗口的响应得分;目标响应得分根据金字塔每一层根滤波器响应值加上部件滤波器响应值之和计算得到;步骤4.5,判断步骤4.4得到的目标响应得分是否大于步骤3设置的行人检测阈值;若目标响应得分大于设置的行人检测阈值,则进行步骤4.6;若目标响应得分小于设置的行人检测阈值,则进行步骤4.7;步骤4.6,标记此目标为行人并在检测结果中保存此目标位置;步骤4.7,标记此目标为非行人目标并在检测结果中删除此目标位置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811006043.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top