[发明专利]搜索引擎的查询优化方法、装置、电子设备在审
申请号: | 202011479817.3 | 申请日: | 2020-12-15 |
公开(公告)号: | CN113407807A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 周智昊;彭志成;安明洋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/9532 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 崔晓岚;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索引擎 查询 优化 方法 装置 电子设备 | ||
本申请提供了一种搜索引擎的查询优化方法、装置、电子设备及计算机可读存储介质;方法包括:获取搜索引擎的历史查询记录,历史查询记录包括多个查询语句,基于查询语句包括的词语生成语法树;基于语法树中每个词语对应的倒排列表包括的信息的数量,调整语法树中的词语的执行顺序;基于调整执行顺序后的语法树进行搜索,并根据搜索结果确定语法树中每个词语的执行顺序,且执行顺序使整体搜索代价最小;其中,语法树用于供搜索引擎在接收到查询语句时进行搜索。通过本申请,能够减少搜索消耗。
技术领域
本申请涉及搜索技术,尤其涉及一种搜索引擎的查询优化方法、装置、电子设备及计算机可读存储介质。
背景技术
人工智能(AI,Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能广泛应用于搜索引擎中,然而随着信息量的不断增长,搜索需要遍历的信息量相应增加,搜索耗时相应变长。在此情况下,相关技术使用复杂的搜索策略,将使搜索耗时更长,影响用户对搜索引擎的使用体验。
发明内容
本申请实施例提供一种搜索引擎的查询优化方法、装置、电子设备及计算机可读存储介质,能够减少搜索消耗。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种搜索引擎的查询优化方法,包括:
获取搜索引擎的历史查询记录,所述历史查询记录包括多个查询语句,基于所述查询语句包括的词语生成语法树;
基于所述语法树中每个词语对应的倒排列表包括的信息的数量,调整所述语法树中的词语的执行顺序;
基于调整执行顺序后的所述语法树进行搜索,并根据搜索结果确定所述语法树中每个词语的执行顺序,且所述执行顺序使整体搜索代价最小;
其中,所述语法树用于供所述搜索引擎在接收到所述查询语句时进行搜索。
本申请实施例提供一种搜索引擎的查询优化装置,包括:
生成模块,用于获取搜索引擎的历史查询记录,所述历史查询记录包括多个查询语句,基于查询语句包括的词语生成语法树;
调整模块,用于基于所述语法树中每个词语对应的倒排列表包括的信息的数量,调整所述语法树中的词语的执行顺序;
确定模块,用于基于调整执行顺序后的所述语法树进行搜索,并根据搜索结果确定所述语法树中每个词语的执行顺序,且所述执行顺序使整体搜索代价最小;其中,所述语法树用于供所述搜索引擎在接收到所述查询语句时进行搜索。
上述方案中,所述生成模块,还用于:
对所述查询语句进行分词处理,得到至少一个词元;
对所述至少一个词元进行同化处理,得到至少一个词语;
对所述至少一个词语进行语法分析,得到表征各个词语之间逻辑关系的逻辑运算符;
基于所述至少一个词语和所述逻辑运算符生成所述语法树。
上述方案中,当所述语法树包括至少两个相邻的与算子时,所述调整模块,还用于:
在所述语法树中,确定所述至少两个相邻的与算子所连接的词语对应的信息的数量;
将所述对应的信息的数量最少的词语的执行顺序调整为首位。
上述方案中,当所述语法树包括至少一个非算子时,所述调整模块,还用于:
在所述语法树中,确定所述至少一个非算子连接的词语对应信息的数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011479817.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:复合防水地板和墙盖板
- 下一篇:半导体存储器器件及其制造方法