[发明专利]对象搜索方法以及装置在审
申请号: | 202210380226.3 | 申请日: | 2022-04-12 |
公开(公告)号: | CN114942972A | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 陈犇;金林波;蒋文 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/2457;G06N3/04;G06N3/08 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 李晓庆 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象 搜索 方法 以及 装置 | ||
1.一种对象搜索方法,包括:
获取目标搜索信息,以及至少一个候选对象的候选属性信息;
根据所述目标搜索信息与所述候选属性信息,构造对应的候选数据对;
将所述候选数据对输入至对象分析模型,获得所述候选数据对的相关性分值,其中,所述对象分析模型由基于至少一个转化因子采样获得的训练样本集训练得到;
根据所述候选数据对的相关性分值,确定所述至少一个候选对象的展示顺序并进行展示。
2.根据权利要求1所述的对象搜索方法,所述候选对象的候选属性信息包括对象类目信息、行业信息和属性关键词;
根据所述目标搜索信息与所述候选属性信息,构造对应的候选数据对,包括:
按照预设拼接规则,将所述目标搜索信息与第一候选对象的对象类目信息、行业信息、属性关键词进行拼接,获得所述目标搜索信息与所述第一候选对象对应的候选数据对,其中,所述第一候选对象为所述至少一个候选对象中的任一个。
3.根据权利要求1所述的对象搜索方法,所述对象分析模型包括特征分析层和输出层;
将所述候选数据对输入至对象分析模型,获得所述候选数据对的相关性分值,包括:
将第一候选数据对输入至所述对象分析模型的特征分析层,获得所述第一候选数据对中各个字符的编码特征,其中,所述第一候选数据对为基于任一候选对象的候选属性信息构造的候选数据对;
融合所述第一候选数据对中第一个字符的编码特征、各个字符的平均编码特征和最大编码特征,确定所述第一候选数据对的目标编码特征;
将所述目标编码特征输入至所述对象分析模型的输出层,获得所述第一候选数据对的相关性分值。
4.根据权利要求1所述的对象搜索方法,根据所述候选数据对的相关性分值,确定所述至少一个候选对象的展示顺序并进行展示,包括:
根据各个候选数据对的相关性分值,将所述至少一个候选对象划分为第一设定数值个档位;
基于设定排序规则对各个档位内的候选对象进行排序;
基于排序结果和所述第一设定数值个档位的档位顺序,展示所述至少一个候选对象。
5.根据权利要求1所述的对象搜索方法,根据所述候选数据对的相关性分值,确定所述至少一个候选对象的展示顺序并进行展示,包括:
根据各个候选数据对的类目信息,将所述至少一个候选对象划分为第二设定数值个类目;
基于相关性分值对各个类目内的候选对象进行排序;
基于排序结果和所述第二设定数值个类目的展示顺序,展示所述至少一个候选对象。
6.根据权利要求1-5任一项所述的对象搜索方法,所述对象分析模型通过如下方法训练获得:
获取预设时间内的用户搜索数据,并根据所述用户搜索数据构造训练样本集,其中,所述训练样本集包括正样本和负样本,所述正样本和所述负样本基于至少一个转化因子采样获得;
将所述训练样本集输入至初始分析模型中,获得所述训练样本集中各个样本对应的预测分值;
基于各个样本的预测分值和样本类型,通过预设边界损失函数计算所述初始分析模型的损失值,根据所述损失值调整所述初始分析模型的模型参数,并返回执行所述获取预设时间段内的用户搜索数据的操作步骤,直至达到训练停止条件,获得训练完成的对象分析模型。
7.根据权利要求6所述的对象搜索方法,所述用户搜索数据包括样本搜索信息和对应的样本搜索结果,所述样本搜索结果包括至少一个样本对象;
根据所述用户搜索数据构造训练样本集,包括:
获取所述样本搜索信息对应的样本搜索结果,确定所述样本搜索结果中所述至少一个转化因子对应的第一样本对象,以及不存在所述至少一个转化因子的第二样本对象;
根据所述样本搜索信息、所述第一样本对象和所述第二样本对象,构造所述训练样本集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210380226.3/1.html,转载请声明来源钻瓜专利网。