[发明专利]一种基于多尺度交互式网络的人群计数方法及系统在审
申请号: | 202011639063.3 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112767316A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 李皓 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/04;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李琳 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 交互式 网络 人群 计数 方法 系统 | ||
1.一种基于多尺度交互式的人群计数方法,其特征在于,包括:
获取待计数人群图像;
将所述人群待计数图像输入预训练的多尺度交互式网络中,输出人群密度图;对所述密度图像素值进行累加求和,获得最终的人群计数结果;
其中,所述多尺度交互式网络包括编码器、聚合交互模块和解码器,编码器包括多层特征提取模块,所述多层特征提取模块通过VGG-16提取到多层特征,所述聚合交互模块通过相互学习的方式有效地融合相邻尺度的特征,解码器包括自交互模块,所述自交互模块从提取的特征中获得丰富的尺度信息。
2.如权利要求1所述的一种基于多尺度交互式的人群计数方法,其特征在于,所述多层特征提取模块以VGG-16为主干,将图像输入到主干网络中,来提取多层特征信息,作为的输入。
3.如权利要求1所述的一种基于多尺度交互式的人群计数方法,其特征在于,所述多层特征模块删除了VGG-16的最后一个最大池化层,来维护最后一个卷积层的细节。
4.如权利要求1所述的一种基于多尺度交互式的人群计数方法,其特征在于,所述聚合交互模块包括若干AIM,所述AIM利用邻层的特征作为输入,通过相互学习的方式融合邻层的上下文特征信息,为获取丰富的多尺度上下文信息提供补充。
5.如权利要求1所述的一种基于多尺度交互式的人群计数方法,其特征在于,所述自交互模块包括若干SIM,通过从层内特征中产生多尺度特征表示,使网络自适应地从数据中提取多尺度信息,并有效处理显著物体的尺度变化。
6.如权利要求1所述的一种基于多尺度交互式的人群计数方法,其特征在于,所述自交互模块中应用了转换-交互-融合策略,具体地说,输入特征的分辨率和维数首先通过卷积层降低,在每个分支中,SIM都会进行初始变换以适应下面的交互操作;通过将低分辨率特征进行上采样,对高分辨率特征进行下采样,使其与他分支的特征的分辨率相同;不同通道数的高分辨率特征与低分辨率特征相互作用,可以获得各种尺度的丰富特征,并以较低的参数量保持高分辨率特征信息。
7.如权利要求1所述的一种基于多尺度交互式的人群计数方法,其特征在于,所述人群密度图利用解码器输出的特征图进行密度回归,得到高质量的人群密度图。
8.一种基于多尺度交互式的人群计数系统,其特征在于,包括:
图像获取单元,被配置为获取待计数人群图像;
计数单元,被配置为将所述人群待计数图像输入预训练的多尺度交互式网络中,输出人群密度图;对所述密度图像素值进行累加求和,获得最终的人群计数结果;
其中,所述多尺度交互式网络包括编码器、聚合交互模块和解码器,编码器包括多层特征提取模块,所述多层特征提取模块通过VGG-16提取到多层特征,所述聚合交互模块通过相互学习的方式有效地融合相邻尺度的特征,解码器包括自交互模块,所述自交互模块从提取的特征中获得丰富的尺度信息。
9.一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一项所述的一种基于多尺度交互式的人群计数方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的一种基于多尺度交互式的人群计数方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011639063.3/1.html,转载请声明来源钻瓜专利网。