[发明专利]一种多粒度注意力机制跨模态行人搜索方法和系统在审
申请号: | 202211240967.8 | 申请日: | 2022-10-11 |
公开(公告)号: | CN115546831A | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 邓若愚;胡尚薇 | 申请(专利权)人: | 同济人工智能研究院(苏州)有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/82;G06V10/74;G06N3/04;G06N3/08 |
代理公司: | 苏州见山知识产权代理事务所(特殊普通合伙) 32421 | 代理人: | 袁丽花 |
地址: | 215000 江苏省苏州市相城区高*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供一种多粒度注意力机制跨模态行人搜索方法和系统,包括以下步骤:1)获取使用摄像拍摄的行人图像,对其进行标注,形成有标注行人图像‑文本对;2)获取无标注行人图像,并通过行人再识别模型计算无标注行人图像与有标注行人图像间的相似度,生成伪标签;3)通过基于改进分块的ResNet‑50网络作为视觉特征提取网络提取行人的全局视觉表征与局部视觉表征;4)通过基于Bert的文本特征提取网络提取行人的文本全局特征、短语级特征与词组级特征;5)将视觉特征与文本特征输入多粒度注意力对齐网络,分别计算全局特征相似性和局部相似性,并通过跨模态投影损失监督含有相同语义的图像区块与文本区域实现各个粒度级别对齐。本申请具有快速准确、鲁棒性好等优点。 | ||
搜索关键词: | 一种 粒度 注意力 机制 跨模态 行人 搜索 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济人工智能研究院(苏州)有限公司,未经同济人工智能研究院(苏州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211240967.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种新结构高效提炼杂质的熔铅锅
- 下一篇:一种分体式空调包装箱