[发明专利]参数取值训练及搜索请求处理方法和装置有效
申请号: | 201310574741.6 | 申请日: | 2013-11-15 |
公开(公告)号: | CN104636407B | 公开(公告)日: | 2019-07-19 |
发明(设计)人: | 郑枫耀 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 董文倩;褚敏 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种参数取值训练及搜索请求处理方法和装置,涉及信息搜索领域,用于提高在线关键词搜索时搜索结果的准确性。本方法中,预先通过模型训练方法得到页面相关度确定方法所使用的参数的训练结果值,该训练结果值能够使得页面排序结果对应的搜索引擎质量衡量指标值符合期望值;在线接收到包含输入的关键词的搜索请求并搜索与用户输入的关键词相关的页面后,根据该页面相关度确定方法和该训练结果值,确定搜索到的每个页面与输入的关键词的相关度并根据各页面的相关度进行页面排序,按照排序结果将各页面的地址信息进行展现。采用本发明可以提高搜索结果的准确性。 | ||
搜索关键词: | 参数 训练 搜索 请求 处理 方法 装置 | ||
【主权项】:
1.一种确定页面相关度所使用参数的取值训练方法,其特征在于,该方法包括:抽取多个离线关键词及每个离线关键词的多个相关页面;收集各离线关键词的各相关页面的历史点击数据;根据抽取的各离线关键词和各相关页面,采用模型训练方法得到页面相关度确定方法所使用的参数的训练结果值,以使在采用所述页面相关度确定方法和所述训练结果值确定离线关键词的相关页面的相关度并根据确定结果将该离线关键词的相关页面进行排序时,能够使排序结果对应的搜索引擎质量衡量指标值符合期望值,其中,所述根据抽取的各离线关键词和各相关页面,采用模型训练方法得到页面相关度确定方法所使用的参数的训练结果值,具体包括:执行多次如下训练操作:采用所述页面相关度确定方法和所述参数的一组可能取值,确定各离线关键词的各相关页面与对应离线关键词的相关度,对于每个离线关键词,分别根据该离线关键词的各相关页面的相关度对该离线关键词的各相关页面进行排序,并确定每次排序结果对应的搜索引擎质量衡量指标值的和值;其中每次训练操作过程中所述页面相关度确定方法所使用的参数的一组可能取值不同;将得到的最大的搜索引擎质量衡量指标值的和值对应的训练操作过程中所述页面相关度确定方法所使用的参数的一组可能取值,作为该参数的训练结果值;其中,所述页面相关度确定方法所使用的参数包括离线参数和在线参数;所述采用所述页面相关度确定方法和所述参数的一组可能取值,确定各离线关键词的各相关页面与对应离线关键词的相关度,具体包括:对于各离线关键词的各相关页面,根据该相关页面的历史点击数据和所述离线参数的可能取值,按照第一设定方法得到该相关页面的离线相关度;根据得到的离线相关度和所述在线参数的可能取值,按照第二设定方法得到每个相关页面的在线相关度;对于每个相关页面,根据该相关页面的在线相关度确定该相关页面与对应离线关键词的相关度;其中,所述第一设定方法包括如下公式一到公式三:公式一:
公式二:
公式三:
其中,p0、p1、p2、p3、p4、p6、p7、p8、p9、p10为离线参数,score为相关页面的离线相关度;QueryTime为在设定时间内相关页面对应的离线关键词被搜索的次数;DocClicks为在设定时间内相关页面被点击的次数;DocFirstClicks为在设定时间内相关页面作为搜索结果中第一个被点击的页面的次数;DocLastClicks为在设定时间内相关页面作为搜索结果中最后一个被点击的页面的次数;DocOnlyClicks为在设定时间内相关页面作为搜索结果中唯一被点击的页面的次数;DocViews为在设定时间内相关页面被浏览过的次数;将所述页面相关度确定方法所使用的参数的训练结果值进行输出,以用于确定关键词的相关页面的相关度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310574741.6/,转载请声明来源钻瓜专利网。