[发明专利]一种基于公共场所场景的轻量级人员重新识别检测方法在审
申请号: | 202210481718.1 | 申请日: | 2022-05-05 |
公开(公告)号: | CN115019244A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 温志刚;邹俊伟;李永;李聪 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V40/10;G06V10/82;G06V10/80;G06V10/764;G06V10/77;G06V10/774;G06N3/04;G06N3/08 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 黄晓军 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 公共场所 场景 轻量级 人员 重新 识别 检测 方法 | ||
1.一种基于公共场所场景的轻量级人员重新识别检测方法,其特征在于,包括:
在轻量级人员重新识别re-ID网络中加入中级特征,构建基于公共场所场景的轻量级re-ID模型;
将待检测的公共场所场景的监控视频流输入到所述轻量级re-ID模型,所述轻量级人员重新识别检测模型输出所述监控视频流中的行人匹配结果。
2.根据权利要求1所述的方法,其特征在于,所述的在轻量级人员重新识别re-ID网络中加入中级特征,构建基于公共场所场景的轻量级re-ID模型,包括:
所述轻量级re-ID网络选取ResNet18网络,该ResNet18网络有两个卷积层,在ResNet18网络最后一层再增加一层卷积层,得到融合了中级特征的ResNet18-mid网络,所述增加的一层卷积层即为融合的中级特征,将融合了中级特征的ResNet18-mid网络作为基于公共场所场景的轻量级re-ID模型。
3.根据权利要求1所述的方法,其特征在于,所述的在轻量级人员重新识别re-ID网络中加入中级特征,构建基于公共场所场景的轻量级re-ID模型,包括:
所述轻量级re-ID网络选取squeezenet网络,将squeezenet网络中的fire模块看作普通卷积层,将squeezenet网络中的中间层的fire模块输出的特征作为中级特征,将所述中级特征通过全局平均池化后输出中级特征向量,将squeezenet网络中的最后一个conv10卷积层作为高级特征,将所述高级特征通过全局平均池化后输出高级特征向量,将所述高级特征向量与所述中级特征向量一起输入融合模块,将所述高级特征向量与所述中级特征向量连接起来,再通过一个全连接层降低维度,得到融合了中级特征的squeezenet-mid网络,将融合了中级特征的squeezenet-mid网络作为基于公共场所场景的轻量级re-ID模型。
4.根据权利要求1所述的方法,其特征在于,所述的在轻量级人员重新识别re-ID网络中加入中级特征,构建基于公共场所场景的轻量级re-ID模型,包括:
所述轻量级re-ID网络选取OSNet网络,将OSNet网络中的conv4层的特征作为中间层特征,将所述中间层特征通过全局平均池化构建中级特征向量;将OSNet网络中的conv5作为高级特征,将所述高级特征经过全局平均池化后得到高级特征向量,将所述高级特征向量与所述中级特征向量一起输入融合模块,将所述高级特征向量与所述中级特征向连接起来,再通过一个全连接层降低维度,得到融合了中级特征的OSNet网络,将融合了中级特征的OSNet网络-mid网络作为基于公共场所场景的轻量级re-ID模型。
5.根据权利要求4所述的方法,其特征在于,所述OSNet网络优先选取OSNet_x1_0网络。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述的将待检测的公共场所场景的监控视频流输入到所述轻量级re-ID模型,所述轻量级re-ID模型输出所述监控视频流中的行人匹配结果,包括:
从待检测的公共场所场景的监控视频流中提取出图片序列,从图片序列中选取一张目标测试图片,将目标测试图片分到query集中,将图片序列中的其他图片分到gallery集中;
利用YOLOV3对query集中的目标测试图片进行行人目标检测,利用Opencv工具对检测后的行人进行矩形框裁剪,将裁剪好的行人矩形框分配到query集;利用YOLOV3对gallery集中的待匹配图片进行行人目标检测,利用Opencv工具对检测后的行人进行矩形框裁剪,将裁剪好的行人矩形框分配到gallery集中;
将目标测试图片的行人裁剪框输入到所述轻量级re-ID网络,所述轻量级re-ID网络将所述目标测试图片的行人裁剪框与gallery集中的各个行人裁剪框进行匹配,根据匹配结果挑选出与所述目标测试图片的行人裁剪框最相似的gallery集中的行人裁剪框,并根据标注输出行人来源图像帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210481718.1/1.html,转载请声明来源钻瓜专利网。