[发明专利]一种基于分层核稀疏表示的行人检测方法有效
申请号: | 201510076218.X | 申请日: | 2015-02-12 |
公开(公告)号: | CN104657717B | 公开(公告)日: | 2018-02-02 |
发明(设计)人: | 孙锐;张旭东;高隽;张广海 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 安徽省合肥新安专利代理有限责任公司34101 | 代理人: | 陆丽莉,何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于分层核稀疏表示的行人检测方法,其特征是按如下步骤进行对采集的交通视频进行预处理,获得需要的正负样本,通过分层的子块划分,获得多尺度的特征向量,并构建两类字典矩阵;对待测的行人图像进行预处理,得到测试样本,用字典构建过程相同的方式进行行人特征提取,形成测试样本的特征向量;采用直方图交叉核函数,对测试样本的特征向量进行核稀疏分解,并在迭代解决过程中采用高斯函数加权,再通过重建误差实现行人检测。本发明可以获得较好的检测性能,有效提高了行人检测在部分遮挡情况下的准确性,增强了行人检测系统对于外观变化的鲁棒性。 | ||
搜索关键词: | 一种 基于 分层 稀疏 表示 行人 检测 方法 | ||
【主权项】:
一种基于分层核稀疏表示的行人检测方法,其特征是按如下步骤进行:步骤1、字典构建:步骤1.1、从交通视频中获取N幅样本图像,从所述N幅样本图像中提取比例为x:y的行人区域和非行人区域;x表示所述行人区域或非行人区域的宽;y表示所述行人区域或非行人区域的高;且x≤y;将所述行人区域和非行人区域进行大小为a×b的归一化处理,分别获得行人正样本和非行人负样本;步骤1.2、分别从所述行人正样本和非行人负样本中选取n个行人正样本和n个行人负样本;并分别转换为n个行人正样本的灰度图和n个行人负样本的灰度图;对所述n个行人正样本的灰度图和n个行人负样本的灰度图分别进行梯度计算,获得n个行人正样本的梯度幅值和n个行人负样本的梯度幅值;由所述n个行人正样本的梯度幅值构成n个正样本的特征图;由n个行人负样本的梯度幅值构成n个负样本的特征图;步骤1.3、从所述n个正样本的特征图和n个负样本的特征图中选出第j个样本,1≤j≤2n;对所述第j个样本进行三层划分,第一层以p1×q1进行划分,第二层以p2×q2进行划分,第三层以p3×q3进行划分,从而获得p1×q1+p2×q2+p3×q3=M个子块,且p1×q1>p2×q2>p3×q3;步骤1.4、对所述第j个样本的第i个子块进行CENTRIST直方图描述子的提取,获得所述第j个样本的第i个子块的m维局部特征向量从而获得所述第j个样本的M个m维局部特征向量1≤i≤M;将所述M个m维局部特征向量进行级联,获得第j个样本的特征向量xj;从而获得2n个样本的特征向量{x1,x2,…,xj,…,x2n};其中,特征向量{x1,x2,…,xn}为正样本的特征向量;特征向量{xn+1,xn+2,…,x2n}为负样本的特征向量;步骤1.5、对所述正样本的特征向量{x1,x2,…,xn}按列排序形成正样本字典X0;对所述负样本的特征向量{xn+1,xn+2,…,x2n}按列排序形成负样本字典X1;由所述正样本字典X0和负样本字典X1构成字典X;由所述n个正样本和n个负样本中所有第i个子块构成的子字典记为第i个子字典Xi′;步骤2:行人检测:步骤2.1、假设测试图像为I,对所述测试图像I进行尺度为u倍到v倍之间的G次缩放处理,获得G幅不同尺度的待检测图像{S1,S2,…,Sg,…SG},Sg表示第g幅待检测图像;1≤g≤G;u≥1;0<v<1;步骤2.2、以a×b为检测窗对所述第g幅待检测图像Sg按照扫描步长为c的“Z”字型进行扫描获得若干个候选区域,记任意个候选区域为D;c∈[2,32];步骤2.3、对所述任意个候选区域D进行梯度计算,获得所述任意个候选区域D的梯度幅值;由所述任意个候选区域D的梯度幅值构成所述任意个候选区域D的特征图;对所述任意个候选区域D的特征图进行三层划分,从而获得所述任意个候选区域D的M个子块;对所述任意个候选区域D的每个子块进行CENTRIST直方图描述子的提取,从而获得M个m维局部特征向量{y1,y2,…,ys,…,yM};ys表示第s个子块所提取的m维局部特征向量;1≤s≤M;对所述M个m维局部特征向量{y1,y2,…,ys,…,yM}进行级联,获得所述任意个候选区域D的特征向量y;步骤2.4、对所述任意个候选区域D的第s个子块利用式(1)进行加权核稀疏表示αs:minαs{Σs=1Mωsk(ys,ys)+αsTΣs=1Mωsk(Xs′,Xs′)αs-2αsTΣs=1Mωsk(Xs′,ys)+λ||αs||1}---(1)]]>式(1)中,ωs表示第s个子块的加权系数,k(·,·)表示直方图交叉核函数;X′s表示第s个子字典;λ表示正则化因子;步骤2.5、利用式(2)计算第s个子块的重建误差es:es=k(ys,ys)+αsTk(Xs′,Xs′)αs-2αsTk(Xs′,ys)---(2)]]>步骤2.6、利用式(3)所示的高斯加权函数计算第s个子块的加权系数ωs:ωs=12πσ2exp(-es22σ2)---(3)]]>式(3)中,σ2表示高斯加权函数的方差;步骤2.7、定义t为迭代次数,并初始化t=1;令初始迭代下的第s个子块的加权系数利用式(4)所示的汇聚条件获得满足式(4)时第t次迭代下的第s个子块的加权系数Σs=1M(ωs(t)-ωs(t-1))2/Σs=1M(ωs(t-1))2<τ---(4)]]>式(4)中,τ为迭代终止参数;步骤2.8、利用所述第t次迭代下的所有子块的加权系数与重建误差的乘积和分别计算所述正样本字典X0的总重建误差和负样本字典X1的总重建误差;步骤2.9、判断所述正样本字典X0的总重建误差是否小于所述负样本字典X1的总重建误差;若小于,则所述任意个候选区域D为行人区域;否则,所述任意个候选区域D为非行人区域;从而获得判定结果;进而获得所述第g幅待检测图像Sg中所有候选区域的检测结果区域;步骤2.10、重复步骤2.2‑步骤2.9,从而获得所述G幅不同尺度的待检测图像{S1,S2,…,Sg,…SG}的所有检测结果区域;步骤2.11、利用非极大抑制算法对所述所有检测结果区域中的重复的检测结果区域进行合并;从而输出行人区域。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510076218.X/,转载请声明来源钻瓜专利网。