[发明专利]一种同义词检索方法和装置在审
申请号: | 202210355598.0 | 申请日: | 2022-04-06 |
公开(公告)号: | CN114691834A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 于楠;蔡玉柱;闫学森;杜波;李舒嫒 | 申请(专利权)人: | 中国农业银行股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/2453;G06F40/284;G06F40/237 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王云晓 |
地址: | 100005 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 同义词 检索 方法 装置 | ||
1.一种同义词检索方法,其特征在于,包括:
获取来自第一应用系统的查询语句,其中,所述查询语句中包括检索词;
从同义词缓存维护的若干应用系统分别对应的同义词列表中,确定所述第一应用系统对应的同义词列表,作为目标同义词列表,其中,所述同义词列表维护有目标词、所述目标词对应的同义词和同义词权重三者的对应关系,所述目标词为应用系统上的原词或原词的同义词;
从所述目标同义词列表中获取所述检索词对应的同义词和同义词权重,并根据所述检索词、所述检索词对应的同义词和同义词权重,生成新的查询语句;
基于所述新的查询语句和所述第一应用系统对应的索引信息,对所述第一应用系统上的信息进行检索,其中,所述第一应用系统对应的索引信息包括针对分词器词库中所述第一应用系统对应的每个词建立的索引信息。
2.根据权利要求1所述的同义词检索方法,其特征在于,还包括:对所述同义词缓存维护的同义词列表进行更新;
所述对所述同义词缓存维护的同义词列表进行更新,包括:
监听是否存在同义词新增任务,其中,所述同义词新增任务中包含新增词和系统指示信息,所述新增词是指为第二应用系统上的原词新增的同义词,所述第二应用系统为所述同义词新增任务中包含的系统指示信息所指示的应用系统;
若存在所述同义词新增任务,则基于所述新增词,以及,所述新增词对应的同义词权重,对所述同义词缓存中所述第二应用系统对应的同义词列表进行更新。
3.根据权利要求2所述的同义词检索方法,其特征在于,还包括:对所述若干应用系统分别对应的索引信息进行更新;
所述对所述若干应用系统分别对应的索引信息进行更新,包括:
若存在所述同义词新增任务,则基于所述分词器词库判断所述新增词是否为未登陆词;
若是,则基于所述新增词更新所述分词器词库,得到更新后的分词器词库;
根据所述更新后的分词器词库和所述第二应用系统对应的原索引库中的索引进行索引重建,得到所述第二应用系统对应的重建后的新索引。
4.根据权利要求3所述的同义词检索方法,其特征在于,所述分词器词库包括搜索引擎集群中各节点分别对应的分词器词库;
所述基于所述新增词更新所述分词器词库,包括:
基于所述新增词生成新增词库文件和词库更新标识文件,并将所述新增词写入所述新增词库文件;
监听所述词库更新标识文件是否更新,若是,则将所述新增词库文件中的所述新增词分别加载到所述搜索引擎集群各节点分别对应的分词器词库。
5.根据权利要求3所述的同义词检索方法,其特征在于,所述根据所述更新后的分词器词库和所述第二应用系统对应的原索引库中的索引进行索引重建,包括:
创建所述第二应用系统对应的新索引库;
根据所述更新后的分词器词库和所述第二应用系统对应的原索引库中的索引,在所述新索引库中进行索引重建。
6.根据权利要求5所述的同义词检索方法,其特征在于,还包括:
若索引重建过程中需要新增索引,则创建过渡索引库,并在将所述过渡索引库设置为默认属性后,将所述新增索引写入所述过渡索引库;
在索引重建完成后,切换所述新索引库为所述默认属性,并将所述过渡索引库中的所述新增索引写入所述新索引库中,得到所述新增索引库包含的重建后的新索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210355598.0/1.html,转载请声明来源钻瓜专利网。