[发明专利]搜索方法、搜索装置、电子设备、存储介质和程序产品在审

专利信息
申请号: 202110431059.6 申请日: 2021-04-21
公开(公告)号: CN112988976A 公开(公告)日: 2021-06-18
发明(设计)人: 程洲 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F16/532;G06F40/289;G06K9/46;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京市金杜律师事务所 11256 代理人: 赵林琳;辛鸣
地址: 100080 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 搜索 方法 装置 电子设备 存储 介质 程序 产品
【权利要求书】:

1.一种搜索方法,包括:

获取图像文本对集合,其中所述图像文本对集合为基于输入图像通过以图搜图得到的搜索结果;

确定所述图像文本对集合中的第一图像文本对中的第一文本与所述图像文本对集合中的第二图像文本对中的第二文本的文本相似度;以及

基于所述文本相似度,确定所述第一图像文本对与所述第二图像文本对的图像文本对相似度。

2.根据权利要求1所述的方法,其中确定所述文本相似度包括:

基于所述第一文本和所述第二文本之间的相同部分来确定所述文本相似度。

3.根据权利要求2所述的方法,其中确定所述文本相似度包括:

以字为单位,确定所述第一文本中、与所述第二文本中所包括的内容相同的第一部分;

确定所述第一部分的字数与所述第一文本的字数的第一比值;

以字为单位,确定所述第二文本中、与所述第一文本中所包括的内容相同的第二部分;

确定所述第二部分的字数与所述第二文本的字数的第二比值;以及

将所述第一比值与所述第二比值的乘积确定为所述文本相似度。

4.根据权利要求3所述的方法,其中:

确定所述第一部分包括以至少两个连续字为单位,确定所述第一文本中、与所述第二文本中所包括的内容相同的所述第一部分;并且

确定所述第二部分包括以至少两个连续字为单位,确定所述第二文本中、与所述第一文本中所包括的内容相同的所述第二部分。

5.根据权利要求1所述的方法,其中确定所述图像文本对相似度包括:

确定所述第一图像文本对中的第一图像与所述第二图像文本对中的第二图像的图像相似度;以及

基于所述文本相似度和所述图像相似度,确定所述第一图像文本对与所述第二图像文本对的所述图像文本对相似度。

6.根据权利要求1所述的方法,其中:

所述第二图像文本对包括多个第二图像文本对;

确定所述文本相似度包括确定所述第一文本与所述多个第二图像文本中的多个第二文本的多个文本相似度;并且

确定所述图像文本对相似度包括确定所述第一图像文本对与所述多个第二图像文本对的多个图像文本对相似度。

7.根据权利要求6所述的方法,还包括:

将所述第一图像文本对和所述多个第二图像文本对中的、图像文本对相似度高于相似度阈值的第二图像文本对确定为正样本;

将所述多个第二图像文本对中的、所述图像文本对相似度不高于所述相似度阈值的第二图像文本对确定为负样本;以及

利用所述正样本和所述负样本来训练搜索模型,使得所述搜索模型能够基于所述输入图像来从所述图像文本对集合选择出所述第一图像文本对和所述图像文本对相似度高于所述相似度阈值的所述第二图像文本对。

8.根据权利要求6或7所述的方法,还包括:

利用所述多个第二图像文本对和所述多个图像文本对相似度来训练排序模型,使得所述排序模型能够基于所述输入图像来按照所述多个图像文本对相似度来对所述多个第二图像文本对排序。

9.一种搜索装置,包括:

获取模块,被配置为获取图像文本对集合,其中所述图像文本对集合为基于输入图像通过以图搜图得到的搜索结果;

第一文本相似度确定模块,被配置为确定所述图像文本对集合中的第一图像文本对中的第一文本与所述图像文本对集合中的第二图像文本对中的第二文本的文本相似度;以及

第一图像文本对相似度确定模块,被配置为基于所述文本相似度,确定所述第一图像文本对与所述第二图像文本对的图像文本对相似度。

10.根据权利要求9所述的装置,其中所述第一文本相似度确定模块包括:

第二文本相似度确定模块,被配置为基于所述第一文本和所述第二文本之间的相同部分来确定所述文本相似度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110431059.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top