[发明专利]搜索模型的更新方法及装置、电子设备和可读存储介质在审
| 申请号: | 202210649487.0 | 申请日: | 2022-06-08 |
| 公开(公告)号: | CN115033581A | 公开(公告)日: | 2022-09-09 |
| 发明(设计)人: | 张诚;吕博良;程佩哲;金驰 | 申请(专利权)人: | 中国工商银行股份有限公司 |
| 主分类号: | G06F16/23 | 分类号: | G06F16/23;G06F16/33;G06F40/289;G06F40/216;G06F40/242;G06F16/35 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 樊晓 |
| 地址: | 100140 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 搜索 模型 更新 方法 装置 电子设备 可读 存储 介质 | ||
本公开提供了一种搜索模型的更新方法及装置、电子设备和可读存储介质,可以应用于人工智能技术领域、信息安全领域和金融领域。该搜索模型的更新方法包括:响应于接收到针对搜索模型的检测请求,将检测请求中的检测文本与搜索模型的热词库进行匹配,得到匹配结果,其中,检测文本包括搜索模型的敏感词库中的至少一个敏感词,热词库包括至少一个热词,匹配结果与至少一个热词相关联;根据敏感词库,对匹配结果进行检测,得到检测结果;在检测结果表征搜索模型存在漏洞的情况下,设置更新规则;基于更新规则,对热词库进行更新,以便更新搜索模型。
技术领域
本公开涉及人工智能技术领域、信息安全领域和金融领域,更具体地,涉及一种搜索模型的更新方法及装置、电子设备、计算机可读存储介质和一种计算机程序产品。
背景技术
随着互联网技术的发展,基于人工智能技术的智能搜索引擎已广泛应用于各种业务场景之中。通过智能搜索引擎,可以针对用户输入的搜索词搜索到与其相关联的搜索结果,并展示给用户。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:无法避免攻击者的影响和篡改,导致无法保障信息的安全性。
发明内容
有鉴于此,本公开提供了一种搜索模型的更新方法及装置、电子设备、计算机可读存储介质和计算机程序产品。
根据本公开的一个方面,提供了一种搜索模型的更新方法,包括:
响应于接收到针对上述搜索模型的检测请求,将上述检测请求中的检测文本与上述搜索模型的热词库进行匹配,得到匹配结果,其中,上述检测文本包括上述搜索模型的敏感词库中的至少一个敏感词,上述热词库包括至少一个热词,上述匹配结果与上述至少一个热词相关联;
根据上述敏感词库,对上述匹配结果进行检测,得到检测结果;
在上述检测结果表征上述搜索模型存在漏洞的情况下,设置更新规则;以及
基于上述更新规则,对上述热词库进行更新,以便更新上述搜索模型。
根据本公开的实施例,上述搜索模型还包括初始热词库,上述初始热词库是通过以下方式来构建的:
获取用户输入上述搜索模型的历史搜索语句;
对上述历史搜索语句进行过滤处理,得到过滤后的历史搜索语句;
对上述过滤后的历史搜索语句进行分词处理,得到多个分词结果;
分别确定上述多个分词结果中两两之间的第一相似度,得到多个上述第一相似度;
在确定多个上述第一相似度中存在第一目标相似度的情况下,统计与上述第一目标相似度对应的分词结果的数量;
在上述分词结果的数量超过第一预设阈值的情况下,将与上述第一目标相似度对应的分词结果确定为热词;以及
根据上述热词,构建上述搜索模型的上述初始热词库。
根据本公开的实施例,上述热词库是通过以下方式来构建的:
利用上述搜索模型,对上述敏感词库中的每个敏感词分别按照预设次数进行搜索;以及
在上述预设次数超过第二预设阈值的情况下,将上述敏感词添加至上述初始热词库,得到上述热词库。
根据本公开的实施例,上述搜索模型还包括语句库,上述语句库是通过以下方式来构建的:
将上述过滤后的历史搜索语句和上述热词映射至倒排索引;以及
根据上述倒排索引,构建上述搜索模型的上述语句库。
根据本公开的实施例,上述将上述检测请求中的检测文本与上述搜索模型的热词库进行匹配,得到匹配结果包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210649487.0/2.html,转载请声明来源钻瓜专利网。





