[发明专利]一种基于动态感受野和自蒸馏的人群计数方法在审
| 申请号: | 202211499074.5 | 申请日: | 2022-11-28 |
| 公开(公告)号: | CN115861924A | 公开(公告)日: | 2023-03-28 |
| 发明(设计)人: | 陈小双;丁玥;施晓华;卢宏涛 | 申请(专利权)人: | 上海交通大学 |
| 主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/774;G06V10/82;G06M1/10;G06N3/08;G06N3/0464 |
| 代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 孟旭彤 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 动态 感受 蒸馏 人群 计数 方法 | ||
本发明公开了一种基于动态感受野和自蒸馏的人群计数方法,解决了传统网络固定大小的感受也不适用于所有场景,对人群密度变化大的场景难以精准计数的问题,其技术方案要点是构建人群计数网络,引入动态感受野模块及自蒸馏监督模块,通过动态感受野模块引入感受野和密度变化之间关系的先验知识,完成对粗略网络的训练,得到具连续变化膨胀系数运用于精细网络的精确膨胀卷积层自蒸馏监督模块对精细网络进行训练,得到与真实效应区域吻合的网络预测输出,本发明的一种基于动态感受野和自蒸馏的人群计数方法,能解决密集人群计数场景中存在的透视效果问题,人群计数精度更高。
技术领域
本发明涉及人群计数技术,特别涉及一种基于动态感受野和自蒸馏的人群计数方法。
背景技术
密集人群计数任务旨在统计密集人群场景中的人群数量。在现实中,密集人群计数有许多应用,例如视频监控、城市交通管理、人流量统计等场景。早期的工作将密集人群计数看作是基于检测的问题,即输出每个人物对象的检测框,然而在人群特别密集的场景中预测结果上的表现比较差。
当前基于卷积神经网络进行密度回归的模型已经成为主流的方法,在精度上取得了非常可观的提升。在这类方法中,对于场景总人数的预测不再通过检测每个目标的位置,而是通过卷积神经网络进行密度估计,生成密度分布图的方式。然而,由于场景中的透视效果,图片中人群的密度变化非常大,识别对象在图片中的大小变化也非常大,因此传统卷积神经网络中固定大小的感受野不适用于所有场景,也不适用于同一场景下的不同位置。
发明内容
本发明的目的是提供一种基于动态感受野和自蒸馏的人群计数方法,能解决密集人群计数场景中存在的透视效果问题,人群计数精度更高。
本发明的上述技术目的是通过以下技术方案得以实现的:
一种基于动态感受野和自蒸馏的人群计数方法,包括有以下步骤:
S1、构建人群计数网络,引入动态感受野模块及自蒸馏监督模块;
S2、对人群计数网络进行训练:
将图片输入至粗略网络中,训练粗略网络直至收敛;
将待预测图片输入至粗略网络中,得到此输入图片的粗略密度图,经线性转换得到膨胀系数图;
将膨胀系数图嵌入至精细网络的卷积层中,并将该图片输入至精细网络中对精细网络进行训练;
基于自蒸馏监督模块的两阶段训练框架对精细网络进行训练,自蒸馏监督模块的教师网络使用精确密度图作为监督目标进行训练,得到用于学生网络训练的软标签密度图;
对软标签密度图中的人数进行调整直至与真值中一致;
学生网络使用调整后的软标签密度图进行训练,直至精细网络收敛;
S3、对人群计数网络进行测试,将待预测图片输入至粗略网络,输出得到粗略密度图并转换后得到膨胀系数图,将膨胀系数图嵌入至精细网络的精确膨胀卷积层中,将该待预测图片输入至精细网络中进行预测并输出最终预测密度图;
S4、将得到的人群计数网络用于人群计数场景中人群数量预测计量。
作为优选,经粗略密度图得到膨胀系数图的线性转换具体为:
其中R是预设的膨胀系数上限,γ是一个正系数,x是粗略网络的输出,即粗略密度图;
通过线性转换,使不同位置的膨胀系数约束在[0,R]区间内。
作为优选,经线性转换得到的膨胀系数图嵌入至精细网络的最后三层卷积层中得到精细膨胀卷积层;
精确膨胀卷积层的输出特征图中第k个位置的数值由以下公式计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211499074.5/2.html,转载请声明来源钻瓜专利网。





