[发明专利]一种基于双注意力多尺度级联网络的目标计数方法及系统有效
申请号: | 201910462177.6 | 申请日: | 2019-05-30 |
公开(公告)号: | CN110188685B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 张世辉;李贺;孔维航;何欢;王爽 | 申请(专利权)人: | 燕山大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 刘凤玲 |
地址: | 066000 河北*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 尺度 级联 网络 目标 计数 方法 系统 | ||
本发明公开一种基于双注意力多尺度级联网络的目标计数方法及系统。方法包括:将灰度化处理后的图像输入至双注意力多尺度级联网络的初始模块进行初始特征提取,得到初始特征图;将初始特征图输入至级联网络的第一分支网络,得到低层细节特征图和高层语义特征图;将上述特征图进行通道注意力变换,生成全局特征信息;将初始特征图输入至级联网络中的第二分支网络的空间注意力金字塔结构,生成图像的多尺度特征;将多尺度特征和全局特征信息进行融合,得到融合结果;将融合结果进行特征抽取,生成估计的目标分布密度图;将目标分布密度图进行像素求和,得到估计的目标计数结果。本发明可有效实现复杂场景下目标精确计数,具有较好的鲁棒性和泛化性。
技术领域
本发明涉及图像处理领域,特别是涉及一种基于双注意力多尺度级联网络的目标计数方法。
背景技术
目标计数是指对场景中某一类特定目标的数量进行估计。目标计数问题对于场景理解、视觉推理等任务中建立高层认知的过程至关重要。成熟的目标计数方法,可以用于监控视频中人群计数及车辆计数,显微镜下细胞计数,及野外开放场景下动植物计数等现实应用。
现有目标计数方法大多针对人群计数和车辆计数进行设计,这主要是由于安防监控技术的广泛应用。现有的目标计数方法主要采用基于密度分布图估计的方法,也就是估计图像中的目标密度分布图,将密度分布图的像素求和即可得到目标计数结果。由于密度分布图估计的方法除了可以提供目标计数结果,还可以提供目标分布的空间信息。现有的目标计数方法大多采用密度分布图估计的方法。但由于目标计数任务中存在外观多尺度和分布不均等因素的存在,现有目标计数方法的准确率和鲁棒性受到限制。
发明内容
本发明的目的是提供一种基于双注意力多尺度级联网络的目标计数方法及系统,通过空间注意力金字塔结构抽取图像的多尺度特征有效解决图像中目标外观多尺度导致计数偏差的问题,通过通道注意力加权融合结构抽取全局特征信息有效提高计数方法的鲁棒性,从而完成准确的目标计数任务。
为实现上述目的,本发明提供了如下方案:
一种基于双注意力多尺度级联网络的目标计数方法,包括:
获取灰度化处理后的图像;
将所述灰度化处理后的图像输入至双注意力多尺度级联网络的初始模块进行初始特征提取,得到初始特征图;所述初始模块包括两个卷积层;
将所述初始特征图输入至所述双注意力多尺度级联网络的第一分支网络,得到低层细节特征图和高层语义特征图;所述第一分支网络包括多个卷积层和多个池化层;
将所述低层细节特征图和所述高层语义特征图进行通道注意力变换,生成全局特征信息;
将所述初始特征图输入至所述双注意力多尺度级联网络中的第二分支网络的空间注意力金字塔结构,生成图像的多尺度特征;
将所述多尺度特征和所述全局特征信息进行融合,得到融合结果;
将所述融合结果进行特征抽取,生成估计的目标分布密度图;
将所述目标分布密度图进行像素求和,得到估计的目标计数结果。
可选的,所述将所述低层细节特征图和所述高层语义特征图进行通道注意力变换,生成全局特征信息,具体包括:
将所述高层语义特征图进行全局池化,得到全局池化后的特征图;
将所述全局池化后的特征图进行一个1×1的卷积,得到卷积后的高层语义特征图;
将所述卷积后的高层语义特征图和所述低层细节特征图进行对应元素相乘,得到全局特征信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于燕山大学,未经燕山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910462177.6/2.html,转载请声明来源钻瓜专利网。