[发明专利]搜索结果的排序方法、装置、电子设备和存储介质有效
申请号: | 202110728343.X | 申请日: | 2021-06-29 |
公开(公告)号: | CN113177162B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 张水发 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9538 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 陈蕾 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 结果 排序 方法 装置 电子设备 存储 介质 | ||
1.一种排序模型的训练方法,其特征在于,包括:
获取样本搜索词的样本搜索结果,对所述样本搜索结果在所述样本搜索词下的样本消费数据分别进行归一化处理得到样本消费参数,并将所述样本搜索结果的多个预设样本消费数据分别对应的样本消费参数的乘积,作为所述样本搜索结果的样本消费质量参数,其中,各个所述样本搜索结果的样本排序位置不同,任一样本搜索结果的样本消费质量参数用于表征该样本搜索结果在消除发布时间因素之后的消费质量;
按照所述样本消费质量参数的大小将各个所述样本搜索结果分别划分至对应于相应参数区间的样本结果集合,并从对应于不同参数区间的多个样本结果集合中分别选取一个样本搜索结果构建训练样本;其中,所述训练样本包括多个样本搜索结果的样本消费质量参数和所述多个样本搜索结果的样本发布时间特征,所述训练样本的样本目标排序结果为所述多个样本搜索结果的样本消费质量参数的大小排序结果;
将所述训练样本输入第一待训练模型,以获取所述第一待训练模型根据各个样本搜索结果的样本消费质量参数对各个样本搜索结果进行排序后输出的样本消费融合参数,并根据所述样本消费融合参数所表征的第一样本预测排序结果与所述样本目标排序结果之间的排序偏差调整所述第一待训练模型的模型参数,以训练得到第一排序模型;
将新样本搜索结果对应的样本消费融合参数扩展至旧样本搜索结果对应的样本消费融合参数的参数范围,所述样本搜索结果被按照发布时间分为晚于预设时刻发布的所述新样本搜索结果和早于所述预设时刻发布的所述旧样本搜索结果;
将所述旧样本搜索结果对应的所述样本消费融合参数和所述新样本搜索结果对应的扩展后的所述样本消费融合参数,作为所述各个样本搜索结果的样本消费融合参数输入第二待训练模型,以获取所述第二待训练模型根据所述样本消费融合参数和所述样本发布时间特征对所述样本搜索结果进行排序后输出的第二样本预测排序结果,并根据所述第二样本预测排序结果与所述样本目标排序结果之间的排序偏差调整所述第二待训练模型的模型参数,以训练得到第二排序模型。
2.根据权利要求1所述的方法,其特征在于,所述按照所述样本消费质量参数的大小将各个所述样本搜索结果分别划分至对应于相应参数区间的样本结果集合,包括:
按照所述样本消费质量参数的大小对各个所述样本搜索结果进行排序;
按照预设的参数区间划分规则,根据所述样本消费质量参数将排序后的各个所述样本搜索结果分别划分至对应于相应参数区间对应的样本结果集合中。
3.根据权利要求1-2中任一项所述的方法,其特征在于,所述样本消费数据包括下述至少之一:
样本点击率、样本零播率、样本短播率、样本长播率、样本完播率、样本平均消费时长、样本关注率、样本点赞率、样本评论率、样本转发率。
4.一种搜索结果的排序方法,其特征在于,包括:
获取目标搜索词的多个搜索结果以及各个搜索结果的消费数据和发布时间特征;
对所述多个搜索结果在所述目标搜索词下的消费数据分别进行归一化处理得到消费参数,并将各个搜索结果的多个预设消费数据分别对应的消费参数的乘积,作为各个搜索结果的样本消费质量参数,任一搜索结果的消费质量参数用于表征该搜索结果在消除发布时间因素之后的消费质量;
将各个搜索结果的所述消费质量参数输入第一排序模型,以获取所述第一排序模型根据所述消费质量参数对所述多个搜索结果进行排序后输出的消费融合参数;并将新搜索结果对应的消费融合参数扩展至旧搜索结果对应的样本消费融合参数的参数范围,其中,所述多个搜索结果被按照发布时间分为晚于预设时刻发布的所述新搜索结果和早于所述预设时刻发布的所述旧搜索结果;
将所述旧搜索结果对应的所述消费融合参数和所述新搜索结果对应的扩展后的所述消费融合参数,作为所述各个样本搜索结果的消费融合参数输入第二排序模型,以获取所述第二排序模型根据所述消费融合参数和发布时间特征对所述多个搜索结果进行排序后输出的排序结果,所述第一排序模型和所述第二排序模型通过如权利要求1至3中任一项所述的排序模型的训练方法预训练得到。
5.根据权利要求4所述的方法,其特征在于,所述消费数据被根据发布方帐号所对应用户实施的消费行为统计得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110728343.X/1.html,转载请声明来源钻瓜专利网。