[发明专利]敏感词查找方法、装置及电子设备有效
申请号: | 201710858344.X | 申请日: | 2017-09-20 |
公开(公告)号: | CN107633062B | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 黄一鸣 | 申请(专利权)人: | 广州四三九九信息科技有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/901;G06F16/335 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 宋南 |
地址: | 510000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 敏感 查找 方法 装置 电子设备 | ||
1.一种敏感词查找方法,其特征在于,包括:
获取各个敏感词,对所述各个敏感词按照字符串大小进行排序,将排序后的各个敏感词进行二进制编码并连续存储,以生成二进制数据词库;
当接收到用户输入的输入文本时,获取所述输入文本中的输入词;
对排序后的所述敏感词进行标号,并记录各个标号对应的敏感词在所述二进制数据词库中的存储地址;
根据所述存储地址及标号,生成索引数据;
根据所述索引数据从所述二进制数据词库中查找与所述输入词匹配的敏感词,以确定所述输入词是否为敏感词。
2.根据权利要求1所述的方法,其特征在于,从所述二进制数据词库中查找与所述输入词匹配的敏感词,以确定所述输入词是否为敏感词包括:
从所述二进制数据词库中读取敏感词,将所述敏感词与所述输入词进行比较,以确定所述输入词是否为敏感词。
3.根据权利要求1所述的方法,其特征在于,所述从所述二进制数据词库中查找与所述输入词匹配的敏感词包括:
采用二分法查找方式,从所述二进制数据词库中查找与所述输入词匹配的敏感词。
4.根据权利要求2所述的方法,其特征在于,所述将所述敏感词与所述输入词进行比较,以确定所述输入词是否为敏感词包括:
比较所述输入词与当前读取的敏感词,获取比较结果;
根据所述比较结果确定所述输入词与所述当前读取的敏感词的匹配程度,其中所述匹配程度包括未匹配、前匹配、全匹配;
根据所述匹配程度确定所述输入词是否为敏感词。
5.根据权利要求2所述的方法,其特征在于,所述二进制数据词库保存在本地文件中;
所述从所述二进制数据词库中读取敏感词包括:
通过随机访问文件的方式从所述本地文件中读取所述敏感词。
6.根据权利要求2所述的方法,其特征在于,所述二进制数据词库保存在本地终端的内存中;
所述从所述二进制数据词库中读取敏感词包括:
通过随机访问内存的方式从所述内存中读取所述敏感词。
7.一种敏感词查找装置,其特征在于,包括:
生成模块,用于获取各个敏感词,对所述各个敏感词按照字符串大小进行排序,将排序后的各个敏感词进行二进制编码并连续存储,以生成二进制数据词库;
获取模块,用于当接收到用户输入的输入文本时,获取所述输入文本中的输入词;确定模块,用于根据索引数据从所述二进制数据词库中查找与所述输入词匹配的敏感词,以确定所述输入词是否为敏感词;其中,对排序后的所述敏感词进行标号,并记录各个标号对应的敏感词在所述二进制数据词库中的存储地址;根据所述存储地址及标号,生成的索引数据。
8.一种电子设备,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至6任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州四三九九信息科技有限公司,未经广州四三九九信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710858344.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种压缩空气成份检测采样装置
- 下一篇:一种用于去除离体血管内皮的灌注装置