[发明专利]一种基于强化学习的排序学习方法及服务器在审
申请号: | 201710114414.0 | 申请日: | 2017-02-28 |
公开(公告)号: | CN108509461A | 公开(公告)日: | 2018-09-07 |
发明(设计)人: | 李伟国;蒋欣;李航 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于强化学习的排序学习方法,包括:服务器获取历史查询词,并获取与历史查询词相对应的M个文档;服务器对M个文档进行排序以获取目标文档排序列表;服务器获取目标文档排序列表的排序效果评估值;服务器将历史查询词、M个文档、目标文档排序列表和排序效果评估值作为一个训练样本,并放入训练样本集合中;当训练样本集中的训练样本的数量大于预设数量时,服务器利用强化学习算法对所述训练样本集合进行训练以获取所述排序模型。采用本发明提供的技术方案有利于精确优化排序指标,从而提高用户对查询词对应的文档排序列表的排序结果的满意度。 | ||
搜索关键词: | 排序 文档 服务器 历史查询 训练样本 训练样本集合 服务器获取 目标文档 强化学习 效果评估 强化学习算法 获取目标 排序结果 排序模型 排序指标 查询词 满意度 放入 预设 学习 优化 | ||
【主权项】:
1.一种基于强化学习的排序学习方法,其特征在于,包括:服务器接收用户输入的查询词;所述服务器获取与所述查询词相匹配的N个文档;其中,所述N为自然数;所述服务器利用排序模型对所述N个文档进行排序以获取文档排序列表;其中,所述排序模型是根据强化学习算法、历史查询词、与所述历史查询词相对应的历史文档、与所述历史查询词对应的文档排序列表以及排序效果评估值训练得到的;所述服务器向所述用户呈现所述文档排序列表。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710114414.0/,转载请声明来源钻瓜专利网。
- 上一篇:分布式系统中的数据一致性检查
- 下一篇:一种同步活动事务表的方法及装置