[发明专利]对疑似词进行处理的方法和装置有效
申请号: | 202010063143.2 | 申请日: | 2020-01-19 |
公开(公告)号: | CN111274805B | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 尹永华;黄培;侯亚乾 | 申请(专利权)人: | 上海众言网络科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/12;G06F16/33 |
代理公司: | 北京卓唐知识产权代理有限公司 11541 | 代理人: | 卜荣丽 |
地址: | 200030 上海市徐汇区宜山路7*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 疑似 进行 处理 方法 装置 | ||
1.一种对疑似词进行处理的方法,其特征在于,所述方法包括:
将获取的待检测文本通过nameko微服务框架进行分发;
将所述分发的文本切割为单词数组;
利用深度优先算法遍历所述单词数组的单词个体,获取疑似词;
将所述疑似词与预设词组进行匹配,确定匹配组合后的疑似词组;
利用nameko微服务框架消费者调用代码完成对所述疑似词组的处理;
所述利用深度优先算法遍历所述单词数组的单词个体,获取疑似词包括;
利用nameko微服务框架内多个消费者,完成深度优先算法遍历对所述单词数组的单词个体,获取疑似词;
所述利用nameko微服务框架消费者调用代码完成对所述疑似词组的处理包括:
将所述疑似词组输入待处理消息队列中;
nameko微服务框架消费者调用代码,对所述待处理消息队列中的疑似词组进行处理;
所述利用nameko微服务框架消费者调用代码完成对所述疑似词组的处理之后还包括:
获取疑似词组的处理结果;
利用Flask构建的web服务,对所述疑似词组的处理结果进行实时查看;
所述利用nameko微服务框架消费者调用代码完成对疑似词组的处理,具体包括:
客户端将需要检测的项目标识和文本内容通过nameko微服务框架的事件分发,将指定待检测文本丢入待处理消息队列中,这个分发过程异步;
基于树结构,将每个词切割成单个词,利用字典将所有词构建成树结构,启动服务后只需构建一次树结构,待检测的文本先切割为单词数组,然后使用深度优先遍历算法遍历数组中的单词个体,即单个字,依次深度优先遍历疑似词树,获取疑似词;
疑似词与预设词组进行匹配,依次将所有疑似词及词组匹配出来,进而确定匹配组合后的疑似词组;
利用nameko微服务框架消费者调用代码完成对疑似词组的处理,此时服务端启用多个消费者服务去处理待检测文本消息队列;
所述利用nameko微服务框架内多个消费者,完成深度优先算法遍历对所述单词数组的单词个体,获取疑似词,具体包括:
实现过程中可以启动nameko微服务框架内多个消费者去消费待检测消息队列,完成深度优先算法遍历对单词数组的单词个体,获取疑似词,加快处理速度;
所述nameko微服务框架消费者调用代码,对待处理消息队列中的疑似词组进行处理,具体包括:
在获取到匹配结果后,对其进行标识,之后将匹配结果及其标识再次使用nameko微服务框架的事件分发,将结果放入需要处理的消息队列中,业务端的nameko微服务框架启动消费者调用业务代码将需要处理的疑似词组依次处理,完成流程;
所述利用Flask构建的web服务,对所述疑似词组的处理结果进行实时查看,具体包括:
获取疑似词组的处理结果,对其处理结果进行标识,服务端使用Flask构建web服务可以实时查看指定标识的处理结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海众言网络科技有限公司,未经上海众言网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010063143.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:在无线网络中的设备隔离
- 下一篇:一种基于词袋多目标学习的后缀翻译方法