[发明专利]复杂场景下的人群计数方法、装置、设备及可读存储介质在审
| 申请号: | 202210093740.9 | 申请日: | 2022-01-26 |
| 公开(公告)号: | CN114494194A | 公开(公告)日: | 2022-05-13 |
| 发明(设计)人: | 荆晓远;程俊豪;张新玉;王许辉;窦习文 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/04;G06N3/08 |
| 代理公司: | 武汉智权专利代理事务所(特殊普通合伙) 42225 | 代理人: | 张凯 |
| 地址: | 430072*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 复杂 场景 人群 计数 方法 装置 设备 可读 存储 介质 | ||
1.复杂场景下的人群计数方法,其特征在于,所述复杂场景下的人群计数方法包括:
将待检测的人群图片输入到训练完成的人群密度图生成模型中的主干网络,得到第一特征向量;
将所述第一特征向量输入到训练完成的人群密度图生成模型中的金字塔多尺度网络,得到第二特征向量,其中,所述金字塔多尺度网络包括预设个数的金字塔多尺度模块,所述金字塔多尺度模块之间为串联连接,每个所述金字塔多尺度模块包括一个消息传递模块和一个注意力模块,所述消息传递模块包括多列采用消息传递机制的全卷积结构,所述注意力模块包括采用注意力机制的全局池化层和卷积层;
将所述第二特征向量输入到训练完成的人群密度图生成模型中的生成网络,得到所述待检测的人群图片对应的人群密度图;
对所述人群密度图的感兴趣区域的目标像素值进行积分求和,得到所述感兴趣区域的总人数。
2.如权利要求1所述的复杂场景下的人群计数方法,其特征在于,所述将所述第一特征向量输入到训练完成的人群密度图生成模型中的金字塔多尺度网络,得到第二特征向量的步骤包括:
将所述第一特征向量输入到训练完成的人群密度图生成模型中的金字塔多尺度网络的第一金字塔多尺度模块,基于所述第一金字塔多尺度模块中的注意力模块,得到注意力向量;
基于所述第一金字塔多尺度模块中的消息传递模块每一列的全卷积结构,得到初始特征向量组,所述初始特征向量组包含预设列数的初始特征向量;
重复执行将所述初始特征向量组中当前列的的全卷积结构生成的初始特征向量与上一列的全卷积结构生成的初始特征向量进行拼接,并输入到一个卷积层中进行融合,得到当前列的输出特征向量的步骤,直到得到所有列的输出特征向量;
将所述所有列的输出特征向量输入到一个卷积层中,融合得到第一融合特征向量;
将所述第一融合特征向量与所述注意力向量进行融合,得到第二融合特征向量,所述第二融合特征向量为所述第一金字塔多尺度模块输出的特征向量;
将所述第一金字塔多尺度模块输出的特征向量输入到第二金字塔多尺度模块,得到第二金字塔多尺度模块输出的特征向量,以此类推,直到得到最后一个金字塔多尺度模块输出的特征向量,所述最后一个金字塔多尺度模块输出的特征向量为第二特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210093740.9/1.html,转载请声明来源钻瓜专利网。





