[发明专利]一种基于查询日志的数据处理方法和系统有效
申请号: | 201410026245.1 | 申请日: | 2014-01-20 |
公开(公告)号: | CN104794129B | 公开(公告)日: | 2018-07-03 |
发明(设计)人: | 杨国东;朱张斌;李群 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 党晓林 |
地址: | 英属开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供一种基于查询日志的数据处理方法和系统。基于查询日志的数据处理方法包括:获取预定时间段搜索引擎的部分或全部的查询日志;对所述查询日志中查询请求的多元共现片段进行频次的统计;对每一多元共现片段,利用该多元共现片段在元数更高的共现片段中的出现频次对所述多元共现片段的频次进行修正;根据多元共现片段的元数及频次选取一个或一个以上多元共现片段;将选取的多元共现片段及其对应的查询结果存储起来。本申请基于查询日志的数据处理系统实施例,可以实现本申请基于查询日志的数据处理方法。利用本申请提供的数据处理方法和系统,可以提高存储内容的查询请求命中率,提升搜索引擎的性能。 | ||
搜索关键词: | 查询日志 数据处理 查询请求 搜索引擎 申请 数据处理系统 预定时间段 查询结果 存储内容 命中率 存储 修正 统计 | ||
【主权项】:
1.一种基于查询日志的数据处理方法,其特征在于,包括:获取预定时间段中搜索引擎的部分或全部的查询日志;对所述查询日志中的查询请求的多元共现片段频次进行统计;所述多元共现片段为:包含多个片段的集合;对于每一多元共现片段,利用该多元共现片段在元数更高的共现片段中的出现频次对所述多元共现片段的频次进行修正;根据多元共现片段的元数及频次选取一个或一个以上多元共现片段;将选取的多元共现片段及其对应的查询结果存储起来。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410026245.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于协同标绘技术的空间知识服务系统建设方法
- 下一篇:数据处理方法和装置