[发明专利]一种基于机器学习的复杂背景下人数检测系统有效
申请号: | 201811170091.8 | 申请日: | 2018-10-08 |
公开(公告)号: | CN109359577B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 魏榕山;欧阳魁;杨培祥 | 申请(专利权)人: | 福州大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350002 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于机器学习的复杂背景下人数检测系统。可在复杂背景下通过视频监控检测人数,提出了一种搭载红外摄像头的基于机器学习的人数检测系统,增强了夜间及弱环境光、低照明度下的人数检测能力,采用基于头肩的聚合通道特征(ACF)算法和Adaboost算法相结合的方法,可以提高在面部存在遮挡、光照不均匀、存在噪声等复杂背景下实时检测人数的正确率和速度,并且可以检测多角度的人体,正面、背面、侧面均可检测。 | ||
搜索关键词: | 一种 基于 机器 学习 复杂 背景 人数 检测 系统 | ||
【主权项】:
1.一种基于机器学习的复杂背景下人数检测系统,其特征在于,包括红外摄像头、搭载基于头肩的聚合通道特征算法和Adaboost算法的ACF检测器的微处理器;所述红外摄像头,用于实时采集图像,形成视频流,并将每一帧图像送入微处理器的ACF检测器中;所述微处理器对输入原始图像进行处理,处理过程如下:(1)通过ACF检测器根据输入图像的高度和宽度计算图像特征金字塔尺度数量,即特征金字塔的层数;生成每个尺度的缩放比例,对输入原始图像进行下采样,即对上一层图像做高斯内核卷积,舍弃偶数行和偶数列,重复以上计算,得到所有层数的图像;(2)使用OpenCV的split函数,将所有层数的图像BGR像素格式拆分为R通道、G通道、B通道,使用OpenCV的rgb2luv_sse函数进行转换,将图像转换到LUV颜色空间,得到L、U、V三个颜色特征通道;(3)对所有层数的图像像素进行非线性变换,计算梯度幅值和梯度方向;梯度幅值取垂直方向的幅值梯度,梯度方向的角度范围为[0,π);与(‑1,0,1)梯度算子做卷积得到水平方向梯度Gx,与(‑1,0,1)T梯度算子做卷积得到垂直方向梯度Gy,梯度方向为
使用2D三角滤波器进行图像的快速卷积;将梯度幅值进行归一化消除不同特征之间量纲不同带来的影响;得到梯度幅值一个特征通道;(4)计算梯度方向直方图;将梯度方向[0,π)分为6个区间,将所有层数的图像的梯度幅值作为权重,把图像的梯度方向投影到6个区间,统计6个区间的投影数,计算梯度方向直方图,得到6个通道特征;(5)经过(2)、(3)、(4)步骤的计算,所有层数图像中每个像素都有一个包含10个特征通道的聚合通道特征;若取得的通道尺寸和预先设定的通道尺寸不匹配,则进行降采样,计算每个通道的系数,以给定的系数进行特征图的重采样,接着调用OpenCV的convTri函数进行图像平滑,最后进行图像填充,前三个通道为颜色通道,采用复制方式进行填充,其余通道为梯度幅值通道和梯度方向直方图通道,采用0进行填充;(6)对所有层数的图像的聚合通道特征进行滑动窗口检测。选取16×16像素大小的窗口,以8像素为步长,从图像的左上角开始,向右和向下滑动,将当前窗口的特征描述子送入经过头肩样本训练的增强弱分类器,分类器对特征描述子进行评分;如果当前窗口评分低于阈值,则立即停止判断,若当前窗口评分高于阈值,则记录该窗口的位置和置信度,框出人体的位置,直到滑动窗口到达图片的右下角;(7)使用caltech行人数据集和MATLAB计算机视觉工具箱处理样本和训练模型;提取行人数据集中的头肩样本的聚合通道特征,采用Adaboost算法训练,得到基于增强决策树的头肩检测分类器;(8)由于在不同尺度下的图片进行特征提取的滑动窗口的大小是不变的,所以需要将经过标记后的图像金字塔中每个尺度的图片放大到原始图像的大小;根据步骤(1)得到的缩放比例,使用OpenCV的resize函数,将经过标记的不同尺度的图像恢复到原始图像大小,就可以把原始图像上的所有人体都标记出来;(9)由于采用滑动窗口检测,同一个人体可能会出现多个标记框,每个框都带有分类器的得分,每个框有可能互相重叠;因此需要去除冗余的标记框,只保留最准确的标记框;由于一帧视频里面可能存在多个人,单纯取得分最高的标记框是不可行的,因此采用非极大值抑制算法,即首先将所有的框按照分类器得分从低到高排序;选择得分最高的框,遍历其余的框,如果和得分最高的框的重叠面积与这两个框面积之间最小值的比值大于设定的阈值,则删除该框;接着从剩下还未处理的框中选取得分最高的框继续以上处理,直到不存在重叠的标记框;(10)统计标记框的个数,即为检测到的人数;并在每个框旁显示置信度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811170091.8/,转载请声明来源钻瓜专利网。