[发明专利]一种嵌入相似性损失函数的文本人员搜索方法有效
申请号: | 201910339800.9 | 申请日: | 2019-04-25 |
公开(公告)号: | CN110222560B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 常晓军;郭军;李智;许鹏飞;陈峰;郭凌;肖云;刘宝英 | 申请(专利权)人: | 西北大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/774;G06V10/74;G06V30/413 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 李婷 |
地址: | 710069 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种嵌入相似性损失函数的文本人员搜索方法,采用三通道神经网络对人员图像和描述文本的数据分别进行特征提取,并且利用余弦距离对正负图文样本对的相似性以及正负样本图像之间的相似性进行计算,然后结合相似性排名损失和实例损失,约束三通道神经网络的训练,提高了对人员搜索的匹配准确率。 | ||
搜索关键词: | 一种 嵌入 相似性 损失 函数 文本 人员 搜索 方法 | ||
【主权项】:
1.一种嵌入相似性损失函数的文本人员搜索方法,其特征在于,包括以下步骤:步骤1,通过监控系统拍摄监控图像,从监控图像中将行人的图像截取出来以获取行人的图像数据,然后对截取出来的行人图像进行文本描述,使得每一张行人图像有对应的详细文本描述语句,利用描述后的行人图像建立数据集;步骤2,构建三通道神经网络模型,并且将数据集中的数据按照三元组的方式输入到网络模型中,分别提取图像和文本的特征,并将这些文本和图像的特征映射到相同维度的特征空间之中;步骤3,通过相同维度的图像和文本特征向量,计算正、负图文样本对的余弦距离,以及正负样本图像之间的余弦距离,从而构建相似性排名损失函数;步骤4,将图像和文本特征分别映射到特征空间之中,并计算图像和文本的实例损失函数;步骤5,通过相似性排名损失和实例损失的双重约束,完成三通道神经网络的训练过程,对模型进行评估,满足要求时保存网络模型用于人员搜索。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910339800.9/,转载请声明来源钻瓜专利网。