[发明专利]一种基于对比学习算法的多模态商标检索方法及系统在审

专利信息
申请号: 202310940020.6 申请日: 2023-07-28
公开(公告)号: CN116662599A 公开(公告)日: 2023-08-29
发明(设计)人: 杜寅辰;徐青伟;严长春;裴非;范娥媚 申请(专利权)人: 知呱呱(天津)大数据技术有限公司
主分类号: G06F16/583 分类号: G06F16/583;G06N3/0455;G06N3/0464;G06N3/0499;G06N3/0895;G06V30/19;G06F16/51;G06F16/55
代理公司: 北京华清科睿知识产权代理事务所(普通合伙) 11989 代理人: 朱红涛
地址: 300221 天津市河西*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 对比 学习 算法 多模态 商标 检索 方法 系统
【权利要求书】:

1.一种基于对比学习算法的多模态商标检索系统,其特征在于,包括数据处理单元、离线建模单元、向量检索单元;其中,

所述数据处理单元,用于分别对商标文本、商标图像进行清洗和格式规范化处理,得到所述商标文本、商标图像相应的结构化文本;

所述离线建模单元,用于训练进行商标图像编码的模型,并将经所述数据处理单元处理的商标图像相应的结构化文本进行编码,生成T维向量,用作向量检索;

所述向量检索单元,用于存储所有商标图像的向量数据和其他相关的标量信息,包括商标名称,商标分类,商标注册号id,并建立索引结构:将所述T维向量空间分解为P个Q维向量空间,其中T=P×Q,并对分解得到的Q维向量空间分别做量化,每个T维向量由P个Q维空间的量化编码组合表示;对每个Q维空间进行聚类,得到L个中心点,检索时计算和每个中心点的距离,以及查表获取每个向量到自己聚类中心点的距离;将需检索的商标向量和向量检索库中的每条数据进行距离计算,选取出最相近的前R个对比商标向量信息。

2.如权利要求1所述的多模态商标检索系统,其特征在于,

所述数据处理单元对商标原始文本,图像数据进行清洗和格式规范化处理,具体包括:

对商标文本数据,从商标数据库中提取出商标注册信息,所述注册信息包括商标名称、商标类型、商标描述信息,去除数据异常商标信息,将提取数据保存成为预定的结构化格式文件;

对商标图像数据,从商标库中读取的商标图像地址中获取图片文件,对所述图片文件格式进行解析,清洗异常图片,调整图像尺寸,对图像统一进行编码,按照商标注册信息、预定格式存储成预定的结构化文本。

3.如权利要求1所述的多模态商标检索系统,其特征在于,

所述离线建模单元将经所述数据处理单元处理的商标图像编码进行编码,生成预定维度的向量,具体包括:

加载所述数据处理单元所处理得到结构化的商标文本、商标图像数据,解析所述商标文本、商标图像数据,提取商标文本和图像信息,并进行配对;将商标文本图像对进行批次划分,每个批次的数量为n;使用图像编码转换器模型对每个批内的商标图像数据进行编码,输出图像向量数据,投影到多模态嵌入矩阵空间中;使用文本编码器预训练模型,对每个批内的商标文本数据进行编码,输出文本向量数据,投影到多模态嵌入矩阵空间中;

将编码后的配对文本图像向量放置到多模态嵌入矩阵空间的对角线位置,将N个配对向量记为训练的正样本,将原本并不对应的文本-图像向量对标记为负样本;

训练文本编码器和图像编码转换器的参数,最大化N 个正样本的余弦相似度,最小化N2-N 个负样本的余弦相似度,迭代W轮训练,生成模型,其中,W≥3;

使用训练后的模型对全量的商标图像数据进行编码,离线生成全部向量,输入到向量检索单元中。

4.如权利要求3所述的多模态商标检索系统,其特征在于,

所述图像编码转换器模型为基于计算机视觉的转换器模型;和/或

所述文本编码器预训练模型为全词进行掩码的中文预训练模型。

5.如权利要求1所述的多模态商标检索系统,其特征在于,还包括:

在线服务单元,将实时输入的检索文本或待检索图像转换成向量,输入到向量检索单元进行检索,整合后将最终结果返回。

6.如权利要求5所述的多模态商标检索系统,其特征在于,所述在线服务单元包括:

以文搜图接口模块,用于调用训练模型的文本编码接口,将输入文本编码成Z维编码向量,调用向量检索单元的检索服务,返回距离最近的前K条商标信息;

以图搜图接口模块,用于调用训练模型的图像编码接口,将输入图像编码成Z维编码向量,调用向量检索单元的检索服务,返回距离最近的前K条商标信息。

7.如权利要求1所述的多模态商标检索系统,其特征在于,还包括:

展示单元,用于接收在线服务单元的排序信息,读取商标注册号id、商标名称、商标描述、商标图像进行列表展示。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于知呱呱(天津)大数据技术有限公司,未经知呱呱(天津)大数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310940020.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top