[发明专利]一种检索字词的方法、装置及介质在审
申请号: | 202210366446.0 | 申请日: | 2022-04-08 |
公开(公告)号: | CN114661869A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 易锋;刘庆强 | 申请(专利权)人: | 政采云有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/284;G06F40/289 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘珂 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检索 字词 方法 装置 介质 | ||
本发明公开了一种检索字词的方法、装置及介质,适用于字词检索技术领域。当字词长度和目标检索字词满足预设条件时,则判断字词长度是否大于第一阈值;若是,则将目标检索字词进行全面匹配检索以得到检索结果,长词在满足预设条件下进行全面匹配搜索;若否,则根据扩展词加载规则和同义词加载规则对目标检索字词进行搜索得到预设检索结果,避免现有的搜索平台仅依靠现有的搜索词库搜索不到的问题;并判断字词长度是否小于第二阈值;若是,则将目标检索字词根据短字匹配规则进行检索得到检索结果,避免现有的短词搜索不到的问题;若否,则将预设检索结果作为检索结果。避免现有的分词压力和匹配汇集耗费计算资源问题,进而提高搜索准确性。
技术领域
本发明涉及字词检索技术领域,特别是涉及一种检索字词的方法、装置及介质。
背景技术
供应商需要在采购平台上查看商品能否被采购人搜索到,但是由于商品状态、商品的销售区域、商品的配送区域以及商品库存等商品不同属性导致在采购平台内匹配不上搜索的条件,进而搜索不到商品。
现有的搜索平台在搜索过程中较多依赖搜索词库,进而对应的分词不准确以及对于新词和专业名词未输入至搜索词库中导致搜不到相对应的目标商品;由于设定的短词为最小的分词单位导致搜索不到目标商品,如红茶、绿茶等为最小分词单位,当检索词为茶一个短词时对应检索不到红茶、绿茶,只有检索词对应为最小分词单位方可检索得到;或者长词查询搜索时形成的分词压力和匹配汇集产生的计算资源等问题导致搜索较慢甚至搜索不到目标词汇,降低用户的体验感,耗费搜索过程中产生的大量计算资源。
因此,寻求一种检索字词的方法是本领域技术人员亟需要解决的。
发明内容
本发明的目的是提供一种检索字词的方法、装置及介质,提高搜索准确性。
为解决上述技术问题,本发明提供一种检索字词的方法,包括:
获取目标检索字词和目标检索字词对应的字词长度;
当字词长度和目标检索字词满足预设条件时,则判断字词长度是否大于第一阈值;
若是,将目标检索字词进行全面匹配检索以得到检索结果;
若否,根据扩展词加载规则和同义词加载规则对目标检索字词进行搜索得到预设检索结果,并判断字词长度是否小于第二阈值,其中第一阈值大于第二阈值;
若小于第二阈值,将目标检索字词根据短字匹配规则进行检索得到检索结果;
若不小于第二阈值,将预设检索结果作为检索结果。
优选地,预设条件为字词长度小于或等于预设值且目标检索字词不包含敏感字词,其中预设值大于第一阈值。
优选地,将目标检索字词进行全面匹配检索以得到检索结果包括:
将目标检索字词拆分成多个分词;
将多个分词进行匹配检索得到检索结果。
优选地,扩展词加载规则的确定通过以下方式得到:
获取待写入检索字词以及对应的扩展字词;
将待写入检索字词和扩展字词确定单向映射关系以确定扩展词加载规则。
优选地,同义词加载规则的确定通过以下方式得到:
获取待写入检索字词以及对应的同义字词;
将待写入检索字词和同义字词确定双向映射关系以确定同义词加载规则。
优选地,短字匹配规则的确定通过以下方式得到:
将待写入检索字词根据最细粒度分词分成多个字并记录多个字对应的位置顺序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于政采云有限公司,未经政采云有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210366446.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大跨度厂房新风系统及施工方法
- 下一篇:一种制盒机及其贴双面胶机构