[发明专利]检测词汇的方法与装置有效
申请号: | 201210361942.3 | 申请日: | 2012-09-25 |
公开(公告)号: | CN102902766A | 公开(公告)日: | 2013-01-30 |
发明(设计)人: | 胡昌玮;李珩;杨贝斯 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/22 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 词汇 方法 装置 | ||
1.一种检测词汇的方法,其特征在于,包括:
步骤a:提取待检测文本中的待检测字符;
步骤b:判断所述待检测字符是否为干扰词汇,当判断结果为是时,转为步骤c,否则,转为步骤d;
步骤c:提取所述待检测文本中与所述待检测字符相邻的下一个字符作为待检测字符,并转为步骤b;
步骤d:将所述待检测字符作为待组合字符,存储到缓存区;
步骤e:根据所述缓存区中的各待组合字符获取待检测词汇;
步骤f:判断所述待所述检测词汇是否为敏感词。
2.根据权利要求1所述的检测词汇的方法,其特征在于,还包括:
当判断出所述待检测词汇为敏感词时,标识所述敏感词,清空所述缓存区,转为步骤c。
3.根据权利要求1或2所述的检测词汇的方法,其特征在于,所述根据各待组合字符获取待检测词汇包括:
按照所述待组合字符存入所述缓存区的顺序形成所述待检测词汇。
4.根据权利要求1所述的检测词汇的方法,其特征在于,在步骤e之后且在步骤f之前,还包括:
根据预设的相关性词库判断所述待检测词汇是否为相关性词汇;
当判断结果出所述待检测词汇不是相关性词汇时,从所述待组合字符中去除所述待检测字符,并判断表示获取待组合字符的计数值是否达到计数最大值,当判断结果为出所述计数值达到计数最大值时,从所述待检测文本中提取与所述缓存区中的首待组合字符相邻的下一个字符作为待检测字符,清空所述缓存区并重置所述计数值,并返回步骤b,否则,将计数值加1,返回步骤c;
当判断结果出所述待检测词汇是相关性词汇时,执行步骤f。
5.根据权利要求2所述检测词汇的方法,其特征在于,还包括:
当判断出所述待检测词汇不是敏感词时,判断所述待检测词汇是否为疑似敏感词,当判断结果为是时,将所述待组合字符保留在所述存储区中,返回步骤c,所述疑似敏感词为包含在敏感词中的词汇。
6.一种检测词汇的装置,其特征在于,包括:
第一提取模块,用于提取待检测文本中的待检测字符;
第一判断模块,用于判断所述待检测字符是否为干扰词汇,当判断结果为是时,触发第二提取模块,否则,触发存储模块;
所述第二提取模块,用于提取所述待检测文本中与所述待检测字符相邻的下一个字符作为待检测字符,并发送到所述第一判断模块;
所述存储模块,用于将所述待检测字符作为待组合字符,存储到缓存区;
组合模块,用于根据所述缓存区中的各待组合字符获取待检测词汇;
第二判断模块,用于判断所述待所述检测词汇是否为敏感词。
7.根据权利要求6所述的检测词汇的装置,其特征在于,还包括:
标识模块,用于当判断出所述待检测词汇为敏感词时,标识所述敏感词,清空所述缓存区,并触发所述第二提取模块。
8.根据权利要求6或7所述的检测词汇的装置,其特征在于,所述组合模块具体用于:
按照所述待组合字符存入所述缓存区的顺序形成所述待检测词汇。
9.根据权利要求8所述所述的检测词汇的装置,其特征在于,还包括:
相关性检测模块,用于根据预设的相关性词库判断所述待检测词汇是否为相关性词汇,当判断出所述待检测词汇不是相关性词汇时,从所述待组合字符中去除所述待检测字符,并判断表示获取待组合字符次数的计数值是否达到计数最大值,当判断出所述计数值达到所述计数最大值时,从所述待检测文本中提取与所述缓存区中的首待组合字符相邻的下一个字符作为待检测字符,清空所述缓存区并重置所述计数值,并触发所述第一判断模块,否则,将计数值加1,触发所述第二提取模块;
当判断结果出所述待检测词汇是相关性词汇时,触发所述第二判断模块。
10.根据权利要求7所述所述的检测词汇的装置,其特征在于,所述第二判断模块还用于:
当判断出所述待检测词汇不是敏感词时,判断所述待检测词汇是否为疑似敏感词,当判断结果为是时,将所述待组合字符保留在所述存储区中,触发所述第二提取模块,所述疑似敏感词为包含在敏感词中的词汇。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210361942.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:模块化分体式背投投影机箱体
- 下一篇:一种可遥控升降式的投影幕布支架