[发明专利]一种基于全局上下文卷积网络的人群计数方法及系统有效
申请号: | 202110382645.6 | 申请日: | 2021-04-09 |
公开(公告)号: | CN113192009B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 康春萌;孟琛;盛星;吕蕾 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V20/52;G06V10/40;G06V10/80;G06V10/82;G06N3/04 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李圣梅 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 全局 上下文 卷积 网络 人群 计数 方法 系统 | ||
本发明提供了一种基于全局上下文卷积网络的人群计数方法及系统,该方法分别提取待计数图像的低级特征图和高级特征图;对低级特征图和高级特征图分别提取多尺度特征,获得具有多尺度信息的特征图;通过对空间信息和通道信息的捕获,将全局上下文特征聚合到每个像素,得到具有上下文信息的特征图,得到像素间的远程依赖关系,使特征图包含更丰富的信息;并通过上采样和特征融合得到人群密度图,提高了人群计数精度。
技术领域
本发明属于深度学习和计算机视觉领域,具体涉及一种基于全局上下文卷积网络的人群计数方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
近年来,由于人群计数在公共安全、城市规划、交通管控等方面的广泛应用,在计算机视觉领域中受到持续的关注。人群计数的目标是准确的从静态图像或帧中估算出人数。由于相机的拍摄角度、人群中不同人与相机之间的距离差异等因素导致拍摄的图像存在尺度变化、严重遮挡、无关背景等问题,使得人群计数算法的准确性受到较大的影响。
目前,基于CNN的方法已经成为人群计数研究的主流方法,其网络架构主要分为单列架构和多列架构。单列架构一般是部署单一的多层卷积神经网络,其网络结构简单,但缺少细节信息和空间信息;多列架构通常采用多尺度或多列结构来捕获更丰富的特征信息,但其结构复杂,计算复杂度高,大多数方法没有充分利用上下文信息和比例信息。为此,最新的一些人群计数方法开始尝试引入空洞卷积、金字塔网络、注意力模型等策略来改善现有的架构,但在应对尺度变化和严重遮挡等问题时仍然存在较大的挑战。
发明内容
本发明为了解决上述问题,提出了一种基于全局上下文卷积网络的人群计数方法及系统,本发明对提取到的低级特征图和高级特征图,分别进行尺度感知和全局上下文提前,以捕获丰富的尺度信息和上下文信息,最终实现更准确预测密度图的目的。
根据一些实施例,本发明采用如下技术方案:
一种基于全局上下文卷积网络的人群计数方法,包括以下步骤:
获取待计数的人群图像;
提取人群图像的低级特征图和高级特征图;
对低级特征图和高级特征图进行尺度感知,得到增强的低级特征图和高级特征图;
对增强的低级特征图和高级特征图依次进行上下文建模和特征转换,提取全局上下文特征,并通过特征融合得到融入全局上下文信息的低级特征图和高级特征图;
根据融入全局上下文信息的低级特征图和高级特征图,确定密度图;
根据密度图进行人群计数。
作为进一步的限定,所述对低级特征图和高级特征图进行尺度感知,得到增强的低级特征图和高级特征图的具体步骤包括:
对低级特征图和高级特征图均通过四个卷积操作来压缩通道,得到压缩后的特征图;
压缩后的低级特征图和高级特征图通过四个不同大小膨胀率的空洞卷积,提取多尺度特征图;
将提取的多尺度特征图按照通道拼接法进行拼接,得到增强的低级特征图和高级特征图。
作为进一步的限定,所述上下文建模的具体步骤为:
将特征图与线性转换矩阵进行卷积操作,并通过softmax函数将注意力权值进行归一化,得到归一化的注意力权值;
对特征图进行reshape操作,并与归一化的注意力权值进行矩阵相乘,得到初始全局上下文特征。
作为进一步的限定,所述特征转换的具体步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110382645.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种印刷电路板的生产工艺
- 下一篇:一种非反应型沥青再生剂渗透性能评价方法