[发明专利]一种垃圾短信的识别方法、装置和移动终端在审
申请号: | 201711192480.6 | 申请日: | 2017-11-24 |
公开(公告)号: | CN107943791A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 郭祥;李强;周楠 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京中强智尚知识产权代理有限公司11448 | 代理人: | 黄耀威 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 垃圾 短信 识别 方法 装置 移动 终端 | ||
技术领域
本发明涉及信息处理领域,特别是涉及一种垃圾短信的识别方法、装置和移动终端。
背景技术
现在手机的垃圾短信越来越多,垃圾短信包括各种公司、网站的宣传内容,当人们查看短信时,需要从众多垃圾短信中寻找自己想要查看的短信内容,并且用户想要删除垃圾短信,还要对每个短信内容进行一一识别然后删除,给手机用户造成不便。
目前,为了解决这种情况,开发出了各种拦截垃圾短信的拦截软件,这些拦截软件可以根据短信中包含的内容,参考包含敏感词汇和垃圾短信发送者号码的黑名单来判断短信是否为垃圾短信,一旦发现该短信是垃圾短信就会对其进行拦截。
然而,这样有可能就会将带有敏感词汇的有用短信当做垃圾短信进行拦截,使用户不能及时获知短信的内容;还有可能出现无法拦截没有敏感词汇、或短信发送者不在黑名单内的垃圾短信,使垃圾短信被当做正常短信。因此,拦截软件无法将所有的垃圾短信识别出来,致使垃圾短信的拦截准确率降低,不方便用户使用。
发明内容
有鉴于此,本发明提供了一种垃圾短信的识别方法、装置和移动终端,主要目的在于可以解决拦截软件无法将所有的垃圾短信识别出来,致使垃圾短信的拦截准确率较低的问题。
依据本发明第一方面,提供了一种垃圾短信的识别方法,包括:
获取终端设备接收到的待检测短信;
根据预设分词词表对所述待检测短信进行最大匹配分词处理,得到待检测分词,所述预设分词词表中保存有预先根据训练短信进行分词处理的各个分词;
通过将所述待检测分词输入到预先配置的短信识别模型进行分析,确定所述待检测短信是否为垃圾短信。
依据本发明第二方面,提供了一种垃圾短信的识别装置,包括:
获取单元,用于获取终端设备接收到的待检测短信;
分词单元,用于根据预设分词词表对所述待检测短信进行最大匹配分词处理,得到待检测分词,所述预设分词词表中保存有预先根据训练短信进行分词处理的各个分词;
分析单元,用于通过将所述待检测分词输入到预先配置的短信识别模型进行分析,确定所述待检测短信是否为垃圾短信。
依据本发明第三方面,提供了一种存储设备,其上存储有计算机程序,所述程序被处理器执行时实现第一方面所述的垃圾短信的识别方法。
依据本发明第四方面,提供了一种移动终端,所述移动终端包括存储设备和处理器,
所述存储设备,用于存储计算机程序;
所述处理器,用于执行所述计算机程序以实现第一方面所述的垃圾短信的识别方法。
借由上述技术方案,本发明提供的一种短信识别模型的获取方法、装置和移动终端,与参考包含敏感词汇和垃圾短信发送者号码的黑名单来判断短信是否为垃圾短信相比,本发明根据预设分词词表对待检测短信进行最大匹配分词处理,得到待检测分词,然后将待检测分词输入到预先配置的短信识别模型进行分析,确定该待检测短信是否为垃圾短信。通过上述方案,利用经过学习训练得到的短信识别模型,根据所有分词的整体分类情况识别整个短信的内容,来判断该短信是否是垃圾短信,有效提高垃圾短信识别的准确率,进而对垃圾短信进行全面的拦截处理。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明的垃圾短信的识别方法的一个实施例的流程图;
图2示出了本发明的垃圾短信的识别方法的训练及检测过程示意图;
图3示出了本发明的垃圾短信的识别方法的另一个实施例的流程图;
图4示出了本发明的短信识别模型的训练过程示意图;
图5示出了本发明的垃圾短信的识别装置的一个实施例的结构示意图;
图6示出了本发明的垃圾短信的识别装置的另一个实施例的结构示意图;
图7示出了本发明的移动终端的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711192480.6/2.html,转载请声明来源钻瓜专利网。