[发明专利]推送信息的方法和装置有效
申请号: | 201210562496.2 | 申请日: | 2012-12-21 |
公开(公告)号: | CN103885979B | 公开(公告)日: | 2018-06-05 |
发明(设计)人: | 高健;陈戈 | 申请(专利权)人: | 深圳市世纪光速信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 罗振安 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 查询字符串 匹配 方法和装置 推送信息 网页 通信技术领域 图片 图片搜索 用户提供 获知 输出 字样 | ||
1.一种推送信息的方法,其特征在于,所述方法包括:
根据网页中历史查询字符串的搜索次数对历史查询字符串进行筛选,得到第一候选查询字符串集,其中,所述第一候选查询字符串集中的每个查询字符串的搜索次数大于第一阈值;
获取所述第一候选查询字符串集中每个查询字符串的相关分数,并根据所述第一候选查询字符串集中每个查询字符串的相关分数对所述第一候选查询字符串集中的查询字符串进行筛选,得到第二候选查询字符串集;
获取所述第二候选查询字符串集中的每个查询字符串包含的预设关键词的个数,并根据所述第二候选查询字符串集中每个查询字符串的相关分数和所述每个查询字符串包含的预设关键词的个数,得到所述第二候选查询字符串集中每个查询字符串的图片倾向分数;
将所述第二候选查询字符串集中查询字符串的图片倾向分数大于第二阈值的查询字符串加入到查询字符串候选集中;
获取网页上输入的指定查询字符串;
将所述指定查询字符串与所述查询字符串候选集中的查询字符串进行匹配,其中,所述查询字符串候选集中的查询字符串是带有图片倾向的查询字符串;
当所述查询字符串候选集中有与所述指定的查询字符串匹配的查询字符串时,根据所述指定查询字符串在所述网页上输出相应的图片。
2.根据权利要求1所述的方法,其特征在于,所述获取所述第一候选查询字符串集中每个查询字符串的相关分数,并根据所述第一候选查询字符串集中每个查询字符串的相关分数对所述第一候选查询字符串集中的查询字符串进行筛选,得到第二候选查询字符串集,包括:
获取所述第一候选查询字符串集中每个查询字符串的指定页中的搜索结果,并提取每条所述搜索结果的标题;
根据所述标题中包含的关键词和所述标题的位置得到所述第一候选查询字符串集中每个查询字符串的相关分数,其中,如果所述标题中包含预设关键词且所述标题的位置在所述结果中的第一指定位置之前或在所述第一指定位置上,则将所述查询字符串的相关分数累加第三阈值,如果所述标题的位置在所述第一指定位置之后,则将所述查询字符串的相关分数累加第四阈值,所述第三阈值大于所述第四阈值,所述查询字符串的相关分数从所述指定页中的第一条搜索结果开始逐条向下累加;
对所述第一候选查询字符串集中的查询字符串进行筛选,当所述第一候选查询字符串集中的查询字符串在第二指定位置上的分数小于第五阈值时,则丢弃该查询字符串,当所述指定页中搜索结果中包含所述预设关键词的标题数小于第六阈值时,则丢弃该查询字符串,得到筛选后的第二候选查询字符串集。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第二候选查询字符串集中每个查询字符串的相关分数和所述每个查询字符串包含的预设关键词的个数,得到所述第二候选查询字符串集中每个查询字符串的图片倾向分数,包括:
当所述第二候选查询字符串集中的查询字符串的相关分数和该查询字符串包含的预设关键词的个数均等于零时,设定该查询字符串的图片倾向分数为零;
当所述第二候选查询字符串集中的查询字符串的相关分数等于零,且该查询字符串包含的预设关键词的个数大于零时,设定该查询字符串的图片倾向分数为第七阈值;
当所述第二候选查询字符串集中的查询字符串的相关分数和该查询字符串包含的预设关键词的个数均大于零时,设定该查询字符串包含的预设关键词的个数为第八阈值,根据2*第八阈值*该查询字符串的相关分数/该查询字符串的长度,得到该查询字符串的图片倾向分数;
当所述第二候选查询字符串集中的查询字符串的相关分数大于零,且该查询字符串包含的预设关键词的个数等于零时,设定该查询字符串包含的预设关键词的个数为第九阈值,根据2*第九阈值*该查询字符串的相关分数/该查询字符串的长度,得到该查询字符串的图片倾向分数。
4.根据权利要求1所述的方法,其特征在于,所述将所述第二候选查询字符串集中查询字符串的图片倾向分数大于第二阈值的查询字符串加入到查询字符串候选集中之后,还包括:
根据所述查询字符串候选集中查询字符串的指定页中的搜索结果的点击率,对所述查询字符串候选集中的查询字符串的图片倾向分数进行修正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世纪光速信息技术有限公司,未经深圳市世纪光速信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210562496.2/1.html,转载请声明来源钻瓜专利网。