[发明专利]搜索排序方法及装置在审
申请号: | 202111431480.3 | 申请日: | 2021-11-29 |
公开(公告)号: | CN114064929A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 崔林 | 申请(专利权)人: | 工银科技有限公司;中国工商银行股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F40/194;G06F40/289 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 董骁毅;崔博 |
地址: | 100029 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 排序 方法 装置 | ||
本申请提供了一种搜索排序方法及装置,可用于金融领域或其他领域,该方法包括:接收目标搜索语句;根据所述目标搜索语句从预设的运维知识库中获得多条召回语句;根据预存储的运维知识图谱、词向量集、所述目标搜索语句和各条召回语句,确定所述目标搜索语句和各条召回语句各自对应的运维知识词以及每个运维知识词的词权重和词向量;根据每个运维知识词的词权重和词向量,确定所述多条召回语句的排序结果并输出。本申请能够提高搜索排序的效率和准确性,进而能够提高数据中心运维的可靠性。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种搜索排序方法及装置。
背景技术
随着社会经济的发展,数据中心等算力基础设施建设成为重中之重。运维作为数据中心的重要环节,是保证数据中心平稳运行的重要支撑。运维属于技术信息密集型的领域,知识范围广、领域多、问题杂、入门难、深入难和传承难的特点。目前,如何解决运维领域的知识积累、搜索和传播等问题存在很大困难。
在日常运维过程中,产生大量有价值的系统文档、预案、问题解决方案、制度法规和操作手册等,大部分文档分散在各类专家手中或是存储在类似confluence的工具中。通过与专家沟通获得知识,存在效率不高的问题;而通过confluence类工具搜索排序知识,存在准确率不高的问题。
发明内容
针对现有技术中的至少一个问题,本申请提出了一种搜索排序方法及装置,能够提高搜索排序的效率和准确性,进而能够提高数据中心运维的可靠性。
为了解决上述技术问题,本申请提供以下技术方案:
第一方面,本申请提供一种搜索排序方法,包括:
接收目标搜索语句;
根据所述目标搜索语句从预设的运维知识库中获得多条召回语句;
根据预存储的运维知识图谱、词向量集、所述目标搜索语句和各条召回语句,确定所述目标搜索语句和各条召回语句各自对应的运维知识词以及每个运维知识词的词权重和词向量;
根据每个运维知识词的词权重和词向量,确定所述多条召回语句的排序结果并输出。
进一步地,所述根据预存储的运维知识图谱、词向量集、所述目标搜索语句和各条召回语句,确定所述目标搜索语句和各条召回语句各自对应的运维知识词以及每个运维知识词的词权重和词向量,包括:
根据预存储的运维知识图谱、所述目标搜索语句和各条召回语句,确定所述目标搜索语句和各条召回语句各自对应的运维知识词以及每个运维知识词的词权重;
根据预存储的词向量集,确定每个运维知识词的词向量。
进一步地,所述根据每个运维知识词的词权重和词向量,确定所述多条召回语句的排序结果并输出,包括:
根据所述目标搜索语句的运维知识词的词权重和词向量,以及每条召回语句的运维知识词的词权重和词向量进行相似度计算;
根据每条召回语句的相似度计算结果,确定所述多条召回语句的排序结果并输出。
进一步地,在所述根据所述目标搜索语句从预设的运维知识库中获得多条召回语句之前,还包括:
获取原始运维知识文档;
将所述原始运维知识文档中的多条运维知识语句,存储在所述预设的运维知识库中;
所述召回语句为根据召回算法从所述预设的运维知识库中获得的与所述目标搜索语句对应的运维知识语句。
进一步地,所述根据所述目标搜索语句从预设的运维知识库中获得多条召回语句,包括:根据多路召回算法和所述目标搜索语句从预设的运维知识库中获得多条召回语句,多路召回算法包括:TFIDF和BM25算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于工银科技有限公司;中国工商银行股份有限公司,未经工银科技有限公司;中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111431480.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多级阻尼钢板弹簧
- 下一篇:一种智能变电站二次系统风险评估方法