[发明专利]搜索引擎的查询优化方法、装置、电子设备在审
申请号: | 202011479817.3 | 申请日: | 2020-12-15 |
公开(公告)号: | CN113407807A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 周智昊;彭志成;安明洋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/9532 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 崔晓岚;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索引擎 查询 优化 方法 装置 电子设备 | ||
1.一种搜索引擎的查询优化方法,其特征在于,所述方法包括:
获取搜索引擎的历史查询记录,所述历史查询记录包括多个查询语句,基于所述查询语句包括的词语生成语法树;
基于所述语法树中每个词语对应的倒排列表包括的信息的数量,调整所述语法树中的词语的执行顺序;
基于调整执行顺序后的所述语法树进行搜索,并根据搜索结果确定所述语法树中每个词语的执行顺序,且所述执行顺序使整体搜索代价最小;
其中,所述语法树用于供所述搜索引擎在接收到所述查询语句时进行搜索。
2.根据权利要求1所述的方法,其特征在于,所述基于所述查询语句包括的词语生成语法树,包括:
对所述查询语句进行分词处理,得到至少一个词元;
对所述至少一个词元进行同化处理,得到至少一个词语;
对所述至少一个词语进行语法分析,得到表征各个词语之间逻辑关系的逻辑运算符;
基于所述至少一个词语和所述逻辑运算符生成所述语法树。
3.根据权利要求1所述的方法,其特征在于,当所述语法树包括至少两个相邻的与算子时,所述基于所述语法树中每个词语对应的倒排列表包括的信息的数量,调整所述语法树中的词语的执行顺序,包括:
在所述语法树中,确定所述至少两个相邻的与算子所连接的词语对应的信息的数量;
将所述对应的信息的数量最少的词语的执行顺序调整为首位。
4.根据权利要求2所述的方法,其特征在于,当所述语法树包括至少一个非算子时,所述基于所述语法树中每个词语对应的倒排列表包括的信息的数量,调整所述语法树中的词语的执行顺序,包括:
在所述语法树中,确定所述至少一个非算子连接的词语对应信息的数量;
将所述至少一个非算子连接的词语的执行顺序调整到其他逻辑运算符连接的词语之后,所述其他逻辑运算符包括与算子和或算子;
其中,当所述语法树包括至少两个非算子时,所述至少两个非算子连接的词语的执行顺序与相应词语所对应的信息的数量的排序一致。
5.根据权利要求3所述的方法,其特征在于,所述基于调整执行顺序后的所述语法树进行搜索,并根据搜索结果确定所述语法树中每个词语的执行顺序,包括:
对所述语法树中其他词语的执行顺序进行调整,得到由所述语法树中的所有词语构成的多个组合,所述其他词语是所述语法树中除所述对应的信息的数量最少的词语之外的词语;
分别对所述多个组合进行搜索,得到对应的多个搜索结果,以及每个搜索结果对应的搜索量;
确定最小搜索量对应的组合中每个词语的执行顺序。
6.根据权利要求3所述的方法,其特征在于,所述基于调整执行顺序后的所述语法树进行搜索,并根据搜索结果确定所述语法树中每个词语的执行顺序,包括:
对所述语法树中其他词语的执行顺序进行调整,得到由所述语法树中的所有词语构成的多个组合,所述其他词语是所述语法树中除所述对应的信息的数量最少的词语之外的词语;
分别对所述多个组合进行搜索,得到对应的多个搜索结果,以及每个搜索结果对应的搜索耗时;
确定最小搜索耗时对应的组合中每个词语的执行顺序。
7.根据权利要求1所述的方法,其特征在于,在所述基于调整执行顺序后的所述语法树进行搜索,并根据搜索结果确定所述语法树中每个词语的执行顺序之后,所述方法还包括:
接收所述搜索引擎发送的携带查询语句的搜索请求;
确定与所述搜索请求中的查询语句匹配的语法树;
基于所述匹配的语法树中各个词语的执行顺序进行搜索,得到至少一个搜索结果;
将所述至少一个搜索结果按照与所述查询语句的相关度降序排序,并返回给所述搜索引擎。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011479817.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:复合防水地板和墙盖板
- 下一篇:半导体存储器器件及其制造方法