[发明专利]敏感词查找方法、装置及电子设备有效

专利信息
申请号: 201710858344.X 申请日: 2017-09-20
公开(公告)号: CN107633062B 公开(公告)日: 2020-05-15
发明(设计)人: 黄一鸣 申请(专利权)人: 广州四三九九信息科技有限公司
主分类号: G06F16/903 分类号: G06F16/903;G06F16/901;G06F16/335
代理公司: 北京超凡志成知识产权代理事务所(普通合伙) 11371 代理人: 宋南
地址: 510000 广东省*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 敏感 查找 方法 装置 电子设备
【说明书】:

发明提供了一种敏感词查找方法、装置及电子设备,涉及计算机技术领域,该敏感词查找方法获取各个敏感词,对各个敏感词进行二进制编码并存储,以生成二进制数据词库;当接收到用户输入的输入文本时,获取该输入文本中的输入词;从上述二进制数据词库中查找与输入词匹配的敏感词,以确定输入词是否为敏感词。相比于基于树或者图进行查找的传统方法,本发明提供的实施例的查找过程是在二进制数据词库中进行的,无需生成多余的节点对象,占用内存小,有效节省了敏感词查找过程中占用的内存,进而保障了应用程序的流畅运行。

技术领域

本发明涉及计算机技术领域,尤其是涉及一种敏感词查找方法、装置及电子设备。

背景技术

当前移动互联网发展迅速,移动游戏和移动应用开发门槛越来越低,无论大小企业或者个人开发者,都能自己开发移动应用程序。如果移动应用或移动游戏具有聊天交流和互动功能,避免不了会有用户发布一些不符合互联网使用环境甚至违反国家法规的词汇,如政治敏感、色情词汇等。因此,为提供健康和谐的互联网环境,需要对敏感词进行过滤。特别是移动游戏,如果不对敏感词进行过滤,该游戏还可能不允许上线到应用市场。

现有敏感词查找方法很多,大多是基于树或图来进行敏感词的查找和过滤。基于树或图的实现,需要生成很多个节点,如果用Java实现,则需要生成很多个节点对象。很多个对象累积起来会占用很大内存,而Java有自动垃圾回收机制,当内存不足时,会触发垃圾回收机制,垃圾回收过程也会占用额外的CPU(Central Processing Unit,中央处理器)资源。

例如Android等移动设备的内存和CPU大小有限,如果在这些移动设备上使用现有的敏感词查找和过滤方法来进行敏感词过滤,会因生成大量对象而占用设备内存,也会因内存不足而频繁触发垃圾回收机制,消耗CPU资源,从而影响游戏或应用的流畅运行,甚至导致卡顿。

发明内容

有鉴于此,本发明的目的在于提供一种敏感词查找方法、装置及电子设备,能够有效节省敏感词查找过程中占用的内存,保障应用程序的流畅运行,缓解了使用现有方法进行敏感词查找时占用大量内存而影响应用程序流畅运行的技术问题。

第一方面,本发明实施例提供了一种敏感词查找方法,包括:

获取各个敏感词,对所述各个敏感词进行二进制编码并存储,以生成二进制数据词库;

当接收到用户输入的输入文本时,获取所述输入文本中的输入词;

从所述二进制数据词库中查找与所述输入词匹配的敏感词,以确定所述输入词是否为敏感词。

结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,从所述二进制数据词库中查找与所述输入词匹配的敏感词,以确定所述输入词是否为敏感词包括:

从所述二进制数据词库中读取敏感词,将所述敏感词与所述输入词进行比较,以确定所述输入词是否为敏感词。

结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述对所述各个敏感词进行二进制编码并存储包括:

将各个敏感词按照字符串大小进行排序,将排序后的各个敏感词进行二进制编码并连续存储。

结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述从所述二进制数据词库中读取敏感词之前,包括:

对排序后的所述敏感词进行标号,并记录各个标号对应的敏感词在所述二进制数据词库中的存储地址;

根据所述存储地址及标号,生成索引数据;

所述从所述二进制数据词库中读取敏感词包括:

根据所述索引数据从所述二进制数据词库中读取敏感词。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州四三九九信息科技有限公司,未经广州四三九九信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710858344.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top