[发明专利]计数图辅助的跨模态人流监控方法和系统在审

专利信息
申请号: 202210348731.X 申请日: 2022-04-01
公开(公告)号: CN114724081A 公开(公告)日: 2022-07-08
发明(设计)人: 董天阳;周宇浩 申请(专利权)人: 浙江工业大学
主分类号: G06V20/52 分类号: G06V20/52;G06T7/00;G06T3/40;G06N3/08;G06N3/04;G06V10/82
代理公司: 杭州天正专利事务所有限公司 33201 代理人: 舒良
地址: 310014 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 计数 辅助 跨模态 人流 监控 方法 系统
【权利要求书】:

1.计数图辅助的跨模态人流监控方法,包括如下步骤:

步骤1,生成计数图;

计数图是对密度图一定区域的积分,能反应出图像的尺度变化;计数图生成方法采用基于深度强化学习的模型LibraNet,该模型LibraNet以VGG16卷积神经网络为前端,以深度强化学习网络为后端,输出计数图;具体包括:

11)训练深度强化模型;选取RGBT-CC数据集为训练用的数据集,该数据集分为训练集、测试集、验证集,每个集合均有RGB、热成像图、标注数据,标注数据显示了热成像图中每个人的头部中心的像素位置;将训练集的热成像图和标注数据作为训练数据,将该测试集的热成像图和标注数据作为测试数据,以此来训练深度强化模型LibraNet;以{-10,-5,-2,-1,1,2,5,10,999}为动作集,其中999为终止动作,剩余的动作表示像素区域中计数值的变化大小,比如5就是该计数值加上5,-5表示该计数值减去5;

12)生成计数图;将训练好的LibraNet模型固定,输入RGBT-CC数据集中所有的热成像图来生成计数图;计数图中的每个值能反应对应热成像图像素区域的大致数量信息;

13)计数图优化;因为生成的计数图的长、宽只有原来的其中n表示作为LibraNet前端的VGG16的池化层数量,需要进行上采样来使大小与原图一致;采用最近邻插值方式进行上采样,并在每个像素位置除以22*n,以使总的计数值不变并且图像大小与原图一致;

步骤2,基于跨模态的网络模型进行人群计数;

设计跨模态网络模型,该模型有四个分支,分为三个输入分支和一个输出分支,三个输入分支分别输入作为三个模态的RGB、热成像图和计数图;输出分支为共享分支,它初始化为0,接收并细化三个模态的信息,它的输出为密度图。除了共享分支外,其余分支均由VGG-19构成。由于VGG-19可分为5层模块,除了最后一层模块,每层模块最后都配备一个2×2的池化层,故三个输入分支均可分为5层模块。共享分支由去除前两层的VGG-19构成,可分为4层模块。设计好模型之后,用RGBT-CC数据集进行训练。训练好模型之后,基于该模型进行人群计数;具体包括:

21)生成上下文信息I;将网络中每个分支每层模块生成的特征图F,用L级金字塔池化层来提取上下文信息I;具体地,对于第l层(l=1,2,...,L),采用一个2l-1×2l-1最大池化层,以h×w特征图F为输入,输出一个特征,然后用最近邻插值方法上采样到h×w,形成上下文特征Fl;最后,上下文信息I可由式(1)计算:

式中表示特征串联操作,Conv1×1表示一个1×1卷积层;

22)细化共享分支特征图;RGB分支、热成像分支、计数图分支和共享分支的每层模块生成的特征图通过公式(1)转化为上下文信息,并将该上下文信息作为输入,输出细化的共享分支的特征图;

具体公式如下:

式中Ir、It、Ic、Is是RGB分支、热成像分支、计数图分支、共享分支每层模块生成的特征图Fr、Ft、Fc、Fs通过公式(1)计算得出的上下文信息,为细化的共享分支特征图,Ir2s、It2s、Ic2s分别是Ir、It、Ic对Is的残差信息,ωr2s、ωt2s、ωc2s是由1×1卷积层输入对应的上下文信息Ir2s、It2s、Ic2s获得的权重参数,⊙是元素级乘法运算;

23)细化RGB分支、热成像分支和计数图分支的特征图;将细化的共享分支特征图通过公式(1)生成上下文特征再以为核心,对的RGB分支、热成像分支、计数图分支每层模块生成的特征图进行细化;具体公式如下:

式中Is2r、Is2t、Is2c分别是细化的共享分支上下文信息对RGB分支、热成像分支、计数图分支每层模块的上下文信息Ir、It、Ic的残差信息,ωs2r、ωs2t、ωs2c是由1×1卷积层输入对应的上下文信息Is2r、Is2t、Is2c获得的权重参数,Fr、Ft、Fc分别是RGB分支、热成像分支、计数图分支每层模块生成的特征图,分别是对RGB分支、热成像分支、计数图分支每层模块生成的特征图细化后的特征图;

24)数据预处理;先计算出RGBT-CC数据集中RGB图、热成像图的均值和方差值,将其归一化;训练时采取随即采样法,采样256×256大小的区块;

25)网络训练;设置好数据集的路径后,就可以进行训练了;训练时仅训练跨模态的部分,对计数图生成模块固定;训练到20周期后,每过1次训练周期进行一次验证,当验证效果最佳时,记录该模型参数,并进行一次测试,得出测试集的评估结果;每训练一个周期都会记录模型参数、优化器参数、训练周期;

26)人群计数;该网络模型训练好后,就可以进行人群计数了;人群计数需要用到RGB图和热成像图,通过热成像图和LibraNet模型生成计数图;以RGB图、热成像图、计数图为输入,输出密度图;密度图作为一种二维数组,能反应计数结果。将密度图里的值进行求和,就能得到作为输入的RGB图像的总人数。

2.计数图辅助的跨模态人流监控系统,其特征在于:计数图生成模块、人群计数模块,其中:

计数图生成模块,计数图是对密度图一定区域的积分,能反应出图像的尺度变化。计数图生成方法采用基于深度强化学习的模型LibraNet,该模型LibraNet以VGG16卷积神经网络为前端,以深度强化学习网络为后端,输出计数图。具体包括:

11)训练深度强化模型。选取RGBT-CC数据集为训练用的数据集,该数据集分为训练集、测试集、验证集,每个集合均有RGB、热成像图、标注数据,标注数据显示了热成像图中每个人的头部中心的像素位置。将训练集的热成像图和标注数据作为训练数据,将该测试集的热成像图和标注数据作为测试数据,以此来训练深度强化模型LibraNet。以{-10,-5,-2,-1,1,2,5,10,999}为动作集,其中999为终止动作,剩余的动作表示像素区域中计数值的变化大小,比如5就是该计数值加上5,-5表示该计数值减去5。

12)生成计数图。将训练好的LibraNet模型固定,输入RGBT-CC数据集中所有的热成像图来生成计数图。计数图中的每个值能反应对应热成像图像素区域的大致数量信息。

13)计数图优化。因为生成的计数图的长、宽只有原来的其中n表示作为LibraNet前端的VGG16的池化层数量,需要进行上采样来使大小与原图一致。采用最近邻插值方式进行上采样,并在每个像素位置除以22*n,以使总的计数值不变并且图像大小与原图一致。

人群计数模块,该模块通过训练好的跨模态网络模型,输入RGB、热成像图和计数图作为三个模态,输出密度图。该模型有四个分支,分为三个输入分支和一个输出分支,三个输入分支分别输入RGB、热成像图和计数图;输出分支为共享分支,它初始化为0,接收并细化三个模态的信息,它的输出为密度图。除了共享分支外,其余分支均由VGG-19构成。由于VGG-19可分为5层模块,除了最后一层,每层模块最后都配备一个2×2的池化层,故三个输入分支均可分为5层模块。共享分支由去除前两层的VGG-19构成,可分为4层模块。通过RGBT-CC数据集进行训练。训练好模型之后,基于该模型进行人群计数。具体包括:

21)生成上下文信息I;将网络中每个分支每层模块生成的特征图F,用L级金字塔池化层来提取上下文信息I;具体地,对于第l层(l=1,2,...,L),采用一个2l-1×2l-1最大池化层,以h×w特征图F为输入,输出一个特征,然后用最近邻插值方法上采样到h×w,形成上下文特征Fl;最后,上下文信息I可由式(1)计算:

式中表示特征串联操作,Conv1×1表示一个1×1卷积层;

22)细化共享分支特征图;RGB分支、热成像分支、计数图分支和共享分支的每层模块生成的特征图通过公式(1)转化为上下文信息,并将该上下文信息作为输入,输出细化的共享分支的特征图;

具体公式如下:

式中Ir、It、Ic、Is是RGB分支、热成像分支、计数图分支、共享分支每层模块生成的特征图Fr、Ft、Fc、Fs通过公式(1)计算得出的上下文信息,为细化的共享分支特征图,Ir2s、It2s、Ic2s分别是Ir、It、Ic对Is的残差信息,ωr2s、ωt2s、ωc2s是由1×1卷积层输入对应的上下文信息Ir2s、It2s、Ic2s获得的权重参数,⊙是元素级乘法运算;

23)细化RGB分支、热成像分支和计数图分支的特征图;将细化的共享分支特征图通过公式(1)生成上下文特征再以为核心,对的RGB分支、热成像分支、计数图分支每层模块生成的特征图进行细化;具体公式如下:

式中Is2r、Is2t、Is2c分别是细化的共享分支上下文信息对RGB分支、热成像分支、计数图分支每层模块的上下文信息Ir、It、Ic的残差信息,ωs2r、ωs2t、ωs2c是由1×1卷积层输入对应的上下文信息Is2r、Is2t、Is2c获得的权重参数,Fr、Ft、Fc分别是RGB分支、热成像分支、计数图分支每层模块生成的特征图,分别是对RGB分支、热成像分支、计数图分支每层模块生成的特征图细化后的特征图;

24)数据预处理;先计算出RGBT-CC数据集中RGB图、热成像图的均值和方差值,将其归一化;训练时采取随即采样法,采样256×256大小的区块;

25)网络训练;设置好数据集的路径后,就可以进行训练了;训练时仅训练跨模态的部分,对计数图生成模块固定;训练到20周期后,每过1次训练周期进行一次验证,当验证效果最佳时,记录该模型参数,并进行一次测试,得出测试集的评估结果;每训练一个周期都会记录模型参数、优化器参数、训练周期;

26)人群计数;该网络模型训练好后,就可以进行人群计数了;人群计数需要用到RGB图和热成像图,通过热成像图和LibraNet模型生成计数图;以RGB图、热成像图、计数图为输入,输出密度图;密度图作为一种二维数组,能反应计数结果。将密度图里的值进行求和,就能得到作为输入的RGB图像的总人数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210348731.X/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top