[发明专利]基于注意力机制循环缩放的人群计数与定位方法和系统有效
| 申请号: | 201910293903.6 | 申请日: | 2019-04-12 |
| 公开(公告)号: | CN110188597B | 公开(公告)日: | 2021-06-15 |
| 发明(设计)人: | 陈刚;刘臣臣;王成成;黄波;韩峻;糜俊青;翁昕钰;穆亚东 | 申请(专利权)人: | 北京大学;中星技术股份有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T7/00;G06N3/04 |
| 代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
| 地址: | 100871 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 注意力 机制 循环 缩放 人群 计数 定位 方法 系统 | ||
本发明涉及一种基于注意力机制循环缩放的密集人群计数与精确定位方法和系统。与原有的基于密度图的人群计数方法以及通过人脸或者行人检测获取人群数量估计的方法不同,本发明通过精心设计的三分支的深度神经网络分别获取输入图像对应的人群计数密度图、人群位置分布图以及用于获取密集候选注意力图。通过人群计数密度图得到图像中初始的人群计数值;通过人群位置分布图得到图像中每个人物的位置坐标;通过密集区域候选图得到图像中人群密集的若干区域,将这些区域从原图中剪切出来并将分辨率放大为原来的两倍,送进后面的网络得到更加精确的人物定位结果。
技术领域
本发明涉及一种图像中密集人群计数和人群精确定位的方法,尤其涉及一种使用注意力机制循环缩放获取人群精确定位的方法和系统,属于计算机视觉领域。
背景技术
随着社会的城镇化发展,城市人口数量急剧上升,视频监控摄像机被密集地安装在许多城市周围,越来越多的使用到我们日常工作和生活中。这些视频数据最重要的应用领域之一就是智能视频监控。拥有了13亿人口的中国,人口数量大引发的一系列问题始终威胁着公众安全。同样在世界上其他地方,举行大型活动时也会因为人群过密发生不可控事件。所以,有效的利用安防监控数据合理调配治安人员以及建设辅助交通设施对人群进行引导分流对于公共秩序的维护和人身安全的保护有着重大意义。然而传统视频监控需要人工监视处理、汇报情况,非常消耗人力物力。自动化的视频分析和处理不仅可以解放劳动力,还可以从海量的视频信息中挖掘数据,学习到有用的知识和规则。人群计数作为视频分析中的一个领域,对于人群行人分析,紧急情况监测,交通规划等多个方面都有着重要的意义。
现有的人群计数技术主要分为基于密度图进行积分估计和人脸或者行人检测进行人数估计两大类。随着深度学习技术的发展,许多研究人员利用深度神经网络学习得到人群的密度图,通过对密度图积分获得图片中人群数量,这一方法已经取得了不错的准确度,但该方法的主要缺点是,虽然学习得到的密度图积分值和图片中人群数量相当,但是学习得到的密度图分布和真实的密度图分布差异较大,不利于进一步的人群分析。
深度学习的发展也使传统的目标检测任务取得了很大的进步,所以有研究人员通过对图像中出现的人脸或者行人进行检测来估计人群数量。这一方法虽然能准确的给出人的位置,避免的基于密度图方法预测分布不准确的缺陷,但是也存在着很大的问题,现有的人脸或行人检测器在超密集场景下的效果很差,而人群估计往往都是超密集场景,很难看清楚的人脸或者人的身体,所以这一方法在这种场景下很难取得好效果。
发明内容
针对密集人群计数中基于密度图方法预测不准确以及基于检测的方法对于密集场景效果不佳的问题,本发明的目的在于提供一种基于注意力机制循环缩放的密集人群计数以及精确定位的解决方法和系统。本发明使用深度学习的方法,提出了一种基于注意力机制的循环缩放网络,该网络将原有的密集图片中人群数量估计问题转化为人群初始估计以及人群精确定位两个问题。
与原有的基于密度图的人群计数方法以及通过人脸或者行人检测获取人群数量估计的方法不同,本发明通过精心设计的三分支的深度神经网络分别获取输入图像对应的人群计数密度图、人群位置分布图以及缩放候选区域注意力图。通过人群计数密度图得到图像中初始的人群计数值;通过人群位置分布图得到图像中每个人物的位置坐标;通过缩放候选区域注意力图得到图像中人群密集的若干区域,将这些区域从原图中剪切出来并将分辨率放大为原来的两倍,送进后面的循环缩放网络得到更加精确的人物定位结果。从人群计数密度图和人群位置分布图中均可得到人群计数值,本发明还提出了一种结合场景自适应权重,以该权重对得到的两个人群计数值进行加权得到更加准确的人群数量估计。
本发明的一种基于注意力机制循环缩放的密集人群计数与精确定位方法,包括以下步骤:
1)建立三分支的深度神经网络,分别获取输入图像对应的人群计数密度图、人群位置分布图以及缩放候选区域注意力图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;中星技术股份有限公司,未经北京大学;中星技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910293903.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:转光装置、成像模组、摄像头组件及电子装置
- 下一篇:电连接器





