[发明专利]一种高效的大数据查询方法有效
申请号: | 201410545402.X | 申请日: | 2014-10-15 |
公开(公告)号: | CN104281698B | 公开(公告)日: | 2017-07-07 |
发明(设计)人: | 胡文彬;艾建文;季统凯 | 申请(专利权)人: | 国云科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广东莞信律师事务所44332 | 代理人: | 余伦 |
地址: | 523808 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及大数据查询技术领域,特别是涉及一种高效的大数据查询方法。本发明在历史查询库中保存了词的历史查询记录;用户输入查询请求时,系统首先分析用户的查询意图,并提供候选关键词供用户选择,用户确定最终的查询关键词后,系统对关键词进行分词处理,从关键词中提取出主词和辅词;系统将主词与历史查询库执行匹配操作,匹配后,将符合的历史查询库结果和新数据的查询结果合并,产生合并结果集,若有辅词,则在合并结果集上继续查询,得到最终查询结果;若无辅词,则直接将合并结果集作为查询结果返回给用户;最后更新历史查询库。本发明节省了大数据搜索时间,提高了查询效率;可以用于大数据的查询上。 | ||
搜索关键词: | 一种 高效 数据 查询 方法 | ||
【主权项】:
一种高效的大数据查询方法,其特征在于:在历史查询库中保存主词的历史查询记录;用户输入查询请求时,首先分析用户的查询意图,并提供候选关键词供用户选择;用户确定最终的查询关键词后,对关键词进行分词处理,从关键词中提取出主词和辅词;系统将主词与历史查询库执行匹配操作,若匹配,则将符合的历史查询库结果和新数据的查询结果合并,产生合并结果集;如有辅词,则在合并结果集上继续查询,得到最终查询结果;如无辅词,则直接将合并结果集作为查询结果返回给用户;若不匹配,则全库执行全新查询后将结果返回给用户;最后更新历史查询库;所述的查询方法详细流程为:第一步,用户通过系统输入查询关键词;第二步,系统通过分析用户的查询请求意图,提供相近的候选查询关键词供用户选择,若用户不选择候选查询关键词,则将用户输入的查询关键词作为本次查询的关键词;用户确定最终的查询关键词后,系统对关键词进行分词处理,提取出主词和辅词;第三步,系统将分词处理后的主、辅词和历史查询库进行匹配处理,历史查询库只保存主词的历史查询结果,匹配的过程会出现3种情况:(1)全匹配:如果是全匹配,则表明用户的查询关键词只有主词,且该主词以前出现过,在历史查询库中有相应的历史查询结果,因此,历史查询库的历史查询结果可以直接为本次查询使用,即共享历史查询库结果;同时,由于历史查询库只是保存某段时间之前的查询数据,有可能在该历史查询后又有新的数据产生,所以对于历史查询库最后时间点之后新增的数据,仍然需要执行查询,最后将新增数据的查询结果和历史查询库的共享结果合并,形成合并结果集,即是用户本次查询的结果;(2)部分匹配:如果是部分匹配,则表明用户输入的查询关键词提取出了主词和辅词,其中主词以前出现过,在历史查询库中有相应的历史查询结果,因此,历史查询库的历史查询结果可以直接为本次查询使用,即共享历史查询库结果;同时,由于历史查询库只是保存某段时间之前的查询数据,有可能在该历史查询后又有新的数据产生,所以对于历史查询库最后时间点之后新增的数据,仍然需要执行查询,然后将新增数据的查询结果和历史查询库的共享结果合并,形成合并结果集;最后在合并结果集中继续对辅词进行查询,得出用户本次查询的结果;(3)完全不匹配:如果是完全不匹配,则表明用户输入的查询关键词没有任何历史查询记录,在历史查询库中不存在,这种情况则需要对全库执行全新的查询处理,最终得到用户本次查询的结果;第四步,将用户本次查询的结果返回给用户;第五步,更新历史查询库中对应主词的查询记录。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国云科技股份有限公司,未经国云科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410545402.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种包装袋在线自动推倒躺平转弯装置
- 下一篇:一种粉料输送装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置