[发明专利]一种视频中密集人群分布检测与计数方法在审
申请号: | 202111259984.1 | 申请日: | 2021-10-28 |
公开(公告)号: | CN114005085A | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 肖进胜;姚韵涛;眭海刚;郭浩文;王中元;张舒豪;周剑 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/25;G06V10/44;G06V10/774;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 许莲英 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 密集 人群 分布 检测 计数 方法 | ||
本发明提出了一种视频中密集人群分布检测与计数方法。首先获取大量含不同密度人群的视频构建数据集;然后构建多尺度特征融合和注意力机制的深度神经网络,将训练集输入至网络,输出对应的人群密度图和注意力图的预测结果,结合真实密度图和注意力图构建损失函数模型进行训练,生成优化后的网络;通过优化后的多尺度特征融合和注意力机制的深度神经网络预测得到人群视频图像的密度图,进一步用基于网格的分层次密度空间聚类方法对估计密度图进行点聚类来识别组群,快速得到组群的人数和位置信息。本发明能解决摄像机透视失真、尺度变化和背景噪声影响的问题,提高了计数精度和稳定性;同时,对人群进行组群划分,可以直观显示出人群的分布情况。
技术领域
本发明涉及智能视频监控邻域中的人群检测方法,特别涉及一种视频中密集人群分布检测与计数方法。
背景技术
随着公共安全、交通场景等领域对安全防范的需求与日俱增,智能视频监控逐渐取代了传统视频监控。人群分布检测与计数是智能视频监控邻域的一个研究热点,有着重要的社会意义和市场应用前景。例如,在人群容易聚集的公共场所,人群信息可用于对踩踏等安全问题进行预警,人群分布信息能帮助合理分配人力、物力资源,从而减少事故伤亡甚至避免事故发生;对于城市公共交通系统,可以根据乘客数量灵活增减车次、制定合理的车辆时刻表,既能避免站台和乘车拥挤、等车时间长又能保证车辆利用率;对于大型商场,可以根据客流量在不同商店中的分布对商店数量、类型和位置进行调整,制定更好的营销策略,提高经济效益。
目前人群计数的方法主要可以分为三类:基于检测的方法、基于回归的方法和基于密度图估计的方法。基于检测的方法在图像上使用基于滑动窗口的人或头部检测器,用低级描述符从头部或身体提取手工特征,通过检测个体直接估计人数。但是,在遮挡严重的拥挤场景中这类方法表现不佳。为了克服遮挡问题,一些工作引入了基于回归的方法。这些方法将人群视为一个整体,直接学习图像特征和图像人数之间的映射关系。基于特征的回归方法通常首先对图像进行前景分割,使人群与背景分离开,然后提取全局特征或者局部特征,最后使用回归模型来学习人群计数的映射函数。这些方法具有高密度人群计数的能力,但忽略了空间信息。基于密度图估计的方法通过学习人群特征和相应密度之间的映射,生成人群密度图,密度图的积分即为人数。与直接输出人数相比,人群密度图能显示人群的分布特征,有助于获得更准确、更全面的信息。
实现准确的人群计数有两个难点:(1)摄像机透视失真。到拍摄设备距离不同的行人大小不同,一幅图像内行人尺度变化明显;(2)场景中背景复杂。人群场景中通常有建筑物、树木等背景噪声。
发明内容
为了解决上述技术所存在的问题,本发明提出了一种视频中密集人群分布检测与计数方法。
本发明提供的技术方案是一种视频中密集人群分布检测与计数方法,其特征在于,包括以下步骤
步骤1:获取大量含不同密度人群的视频构建数据集;
步骤2:构建多尺度特征融合和注意力机制的深度神经网络,将步骤1.1中构建的训练样本集依次输入至多尺度特征融合和注意力机制的深度神经网络,输出训练样本集对应的人群密度图和注意力图的预测结果,进一步结合步骤1.2中训练样本集对应的真实密度图和步骤1.3中训练样本集对应的真实注意力图构建损失函数模型,利用损失函数模型进行训练,直至损失函数模型的损失减小到一定程度且训练达到迭代最大次数,生成优化后多尺度特征融合和注意力机制的深度神经网络;
步骤3:对于人群视频图像,通过步骤2中优化后的多尺度特征融合和注意力机制的深度神经网络预测得到人群密度图,进一步用基于网格的分层次密度空间聚类方法对输出的估计人群密度图进行点聚类来识别组群,快速得到组群的人数和位置信息。
作为优选,步骤1所述获取大量含不同密度人群的视频构建数据集的具体实现方式如下:
步骤1.1:标注人群图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111259984.1/2.html,转载请声明来源钻瓜专利网。