[发明专利]一种词条权重的计算方法、搜索方法及相关装置有效
申请号: | 201910203912.1 | 申请日: | 2019-03-18 |
公开(公告)号: | CN109933714B | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 石翔;陈炜鹏;许静芳 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/18;G06F16/33;G06F40/289 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 朱静 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例公开一种词条权重的计算方法,在构建相似搜索词集合后,针对相似搜索词集合中包括的每个搜索词,计算每个搜索词对应的搜索结果点击率。以相似搜索词集合中的一搜索词作为第一搜索词,依据第一搜索词所属相似搜索词集合包括的各搜索词分别对应的搜索结果点击率,计算第一搜索词与其所属相似搜索词集合中各搜索词之间的相关程度。之后,针对所述第一搜索词包括的各分词词条,依据第一搜索词与其所属相似搜索词集合中各搜索词之间的相关程度,计算得到第一搜索词包括的各个分词词条的词条权重。利用得到的词条权重可以更准确地从用户输入搜索词中提取出准确的核心词,或者针对用户输入的搜索词返回合理的搜索结果项排序,提高用户体验。 | ||
搜索关键词: | 一种 词条 权重 计算方法 搜索 方法 相关 装置 | ||
【主权项】:
1.一种词条权重的计算方法,其特征在于,所述方法包括:针对用户点击日志数据中的搜索词,构建相似搜索词集合,其中,相似搜索词集合中的各搜索词为所述点击日志数据中点击到同一搜索结果项的搜索词;针对相似搜索词集合中包括的每个搜索词,计算得到每个搜索词对应的搜索结果点击率;其中,所述搜索结果点击率为搜索词针对其所属相似搜索词集合对应的搜索结果项的点击率;以所述相似搜索词集合中的一搜索词作为第一搜索词,依据第一搜索词所属相似搜索词集合包括的各搜索词分别对应的搜索结果点击率,计算所述第一搜索词与其所属相似搜索词集合中各搜索词之间的相关程度;对所述第一搜索词进行分词,得到所述第一搜索词包括的至少一个分词词条;针对所述第一搜索词包括的各分词词条,依据所述第一搜索词与其所属相似搜索词集合中各搜索词之间的相关程度,计算得到所述第一搜索词包括的每个分词词条的词条权重。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910203912.1/,转载请声明来源钻瓜专利网。