[发明专利]敏感词过滤的方法、装置、移动终端及存储介质在审
申请号: | 201711414090.9 | 申请日: | 2017-12-25 |
公开(公告)号: | CN108228760A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 邱振东 | 申请(专利权)人: | 湛江正信科技服务有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L13/08 |
代理公司: | 广州广信知识产权代理有限公司 44261 | 代理人: | 张文雄 |
地址: | 524022 广东省湛江市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种敏感词过滤的方法,包括步骤:第一转换步骤:将敏感词文本库转换成敏感词音频数据库,根据敏感词查找树结构建立确定有机状态自动机中各个敏感词的转换函数,将所述敏感词音频数据库中的敏感词构建成敏感词树;接收步骤:接收待发送的文本文件,并存储为临时文本文件;第二转换步骤:将临时文本文件转换成临时音频数据文件并存储;比对步骤:将所述敏感词树分别与临时音频数据文件进行比对;过滤步骤:对临时文本文件进行过滤,并将过滤后的临时文本文件发送至接收终端。本发明还公开了一种敏感词过滤的装置、移动终端和计算机可读存储介质。本发明在很大程度上满足信息过滤的要求,而且计算量小、速度快。 | ||
搜索关键词: | 敏感词 文本文件 过滤 音频数据文件 转换 音频数据库 移动终端 计算机可读存储介质 存储 发送 比对步骤 存储介质 接收终端 信息过滤 有机状态 转换函数 计算量 树结构 文本库 自动机 比对 查找 | ||
【主权项】:
1.一种敏感词过滤的方法,其特征在于,包括步骤:第一转换步骤:通过文本‑语音转换将敏感词文本库转换成敏感词音频数据库,根据敏感词查找树结构建立确定有机状态自动机中各个敏感词的转换函数,将所述敏感词音频数据库中的敏感词构建成敏感词树;接收步骤:接收待发送的文本文件,并存储为临时文本文件;第二转换步骤:通过文本‑语音转换将临时文本文件转换成临时音频数据文件并存储,所述临时文本文件和临时音频数据文件相关联;比对步骤:将所述敏感词树分别与临时音频数据文件进行比对,获得所述临时音频数据文件中具有的敏感词树,组成音频过滤集合,并记录这些敏感词树在临时音频数据文件中的位置;过滤步骤:对临时文本文件进行过滤,并将过滤后的临时文本文件发送至接收终端,所述对临时文本文件进行过滤的方法是将临时文本文件中与所述位置相对应的文本内容进行删除。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湛江正信科技服务有限公司,未经湛江正信科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711414090.9/,转载请声明来源钻瓜专利网。