[发明专利]一种搜索重排模型的确定方法及装置在审
申请号: | 202210367936.2 | 申请日: | 2022-04-08 |
公开(公告)号: | CN114722086A | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 张志钢 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 重排 模型 确定 方法 装置 | ||
本申请公开了一种搜索重排模型的确定方法及装置,通过初始打分排序模型对目标搜索词的多个搜索结果条目进行初始排序打分获得各自的初始排序分数,通过打分评估模型根据期望排序对初始排序分数进行评估,并确定各自的奖励分数;进一步根据初始排序分数和奖励分数确定多个搜索结果条目的损失函数,并根据该损失函数对初始打分模型进行排序模型训练,获得用于对多个搜索结果条目进行搜索重排的目标打分排序模型。由于奖励分数是基于期望排序确定的,因此利用根据初始排序分数和奖励分数确定的损失函数对初始打分排序模型进行排序模型训练,使得初始打分排序模型能够向输出期望排序的方向进行优化,获得目标打分排序模型,提高排序结果的准确度。
技术领域
本申请涉及数据处理领域,特别是涉及一种搜索重排模型的确定方法及装置。
背景技术
随着信息技术的快速发展,在线搜索成为人们获取信息的重要途径之一。具体的,用户在搜索系统中输入搜索词后,系统将召回大量的搜索结果条目,并对其进行初排、精排,最终将部分展示给用户。
在搜索系统中,搜索排序的质量好坏很大程度地影响了页面质量,具体是指,向用户展示搜索结果的页面中所显示的搜索结果与用户的搜索期望之间的匹配程度。当页面质量较差时,将带给用户大量冗余信息的呈现,降低用户获取信息的效率;当页面质量较好时,将为用户展示一个更加符合用户预期内容的页面,提高用户获取信息的效率。
可见,如何提高针对待排序的搜索结果条目的排序结果的准确度,对于提高用户的搜索体验具有重要的意义。
发明内容
为了解决上述技术问题,本申请提供了一种搜索重排模型的确定方法及装置,提高了对目标搜索词的搜索结果排序的准确度。
本申请实施例公开了如下技术方案:
一方面,本申请实施例提供了一种搜索重排模型的确定方法,所述方法包括:
获取目标搜索词对应的训练样本集;所述训练样本集包括所述目标搜索词和所述目标搜索词的多个搜索结果条目;
将所述训练样本集输入初始打分排序模型,通过所述初始打分排序模型确定所述多个搜索结果条目各自的初始排序分数;
将包括目标排序标签的所述训练样本集和所述初始排序分数输入打分评估模型,通过所述打分评估模型基于所述目标排序标签和所述初始排序分数,确定所述初始排序分数各自的奖励分数;其中,所述目标排序标签用于标识所述训练样本集中的所述多个搜索结果条目的期望排序;
基于所述初始排序分数和所述奖励分数,确定所述多个搜索结果条目的损失函数;
根据所述损失函数对所述初始打分排序模型进行排序模型训练,得到用于对所述多个搜索结果条目进行搜索重排的目标打分排序模型。
另一方面,本申请实施例提供了一种搜索重排模型的确定装置,所述装置包括获取单元、确定单元和训练单元:
所述获取单元,用于获取目标搜索词对应的训练样本集;所述训练样本集包括所述目标搜索词和所述目标搜索词的多个搜索结果条目;
所述确定单元,用于将所述训练样本集输入初始打分排序模型,通过所述初始打分排序模型确定所述多个搜索结果条目各自的初始排序分数;
所述确定单元,还用于将包括目标排序标签的所述训练样本集和所述初始排序分数输入打分评估模型,通过所述打分评估模型基于所述目标排序标签和所述初始排序分数,确定所述初始排序分数各自的奖励分数;其中,所述目标排序标签用于标识所述训练样本集中的所述多个搜索结果条目的期望排序;
所述确定单元,还用于基于所述初始排序分数和所述奖励分数,确定所述多个搜索结果条目的损失函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210367936.2/2.html,转载请声明来源钻瓜专利网。