[发明专利]对疑似词进行处理的方法和装置有效

申请号：	202010063143.2	申请日：	2020-01-19
公开（公告）号：	CN111274805B	公开（公告）日：	2020-11-20
发明（设计）人：	尹永华;黄培;侯亚乾	申请（专利权）人：	上海众言网络科技有限公司
主分类号：	G06F40/289	分类号：	G06F40/289;G06F40/12;G06F16/33
代理公司：	北京卓唐知识产权代理有限公司 11541	代理人：	卜荣丽
地址：	200030 上海市徐汇区宜山路7***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	疑似进行处理方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种对疑似词进行处理的方法和装置，该方法包括：将获取的待检测文本通过nameko微服务框架进行分发；将分发的文本切割为单词数组；利用深度优先算法遍历单词数组的单词个体，获取疑似词；将疑似词与预设词组进行匹配，确定匹配组合后的疑似词组；利用nameko微服务框架消费者调用代码完成对疑似词组的处理。通过本发明业务方客户端无需等待，将需要处理的数据分发到指定消息队列即可，不会影响业务服务器，处理过程独立成一套微服务，可以单独更新启动及维护，当需要改变疑似词组合时，仅在疑似词服务器上进行即可，可达到实时效果；同时，在匹配方面，疑似词树启动时只需构建一次树结构，存在内存缓存，检测速度快。

技术领域

本发明涉及计算机技术领域，尤其涉及一种对疑似词进行处理的方法和装置。

背景技术

服务器在待处理文本所处的消息队列里，会对一些没有出现在字典中的词我们称为“疑似词”进行处理，通常会利用服务器对疑似词的组合完成查询和更新，每查询一次就要更新一次业务代码，这样在待检测文本数据很大的情况下，会由于每次的更新和疑似词的重新匹配，导致匹配效率降低，且服务器工作负荷加重。

鉴于此，急需一种对疑似词进行快速处理且不影响服务器正常运行的方法。

发明内容

为了解决现有技术匹配效率低，服务器负荷加重的问题，本发明提供一种对疑似词进行处理的方法和装置。

第一方面，本发明提供一种对疑似词进行处理的方法，该方法包括：

将获取的待检测文本通过nameko微服务框架进行分发；

将分发的文本切割为单词数组；

利用深度优先算法遍历单词数组的单词个体，获取疑似词；

将疑似词与预设词组进行匹配，确定匹配组合后的疑似词组；