[发明专利]一种垃圾短信过滤方法、系统、移动终端以及云服务器有效
申请号: | 201310279728.8 | 申请日: | 2013-07-04 |
公开(公告)号: | CN104284306B | 公开(公告)日: | 2018-07-24 |
发明(设计)人: | 何通庆;郭伟;方礼勇;杜国楹 | 申请(专利权)人: | 北京壹人壹本信息科技有限公司 |
主分类号: | H04W4/14 | 分类号: | H04W4/14;H04L29/08;G06F17/30 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何青瓦 |
地址: | 101105 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 垃圾 短信 过滤 方法 系统 移动 终端 以及 服务器 | ||
本发明实施方式公开了一种垃圾短信过滤方法,包括:移动终端根据其存储的分类词库对待处理短信进行分类以获得分类结果,当分类结果被判定为错误的分类结果且移动终端接收到对应错误的分类结果的上传指令时,移动终端将分类错误信息上传到云服务器以更新与移动终端对应的私有短信训练集,移动终端获得云服务器的词库更新信息以同步更新移动终端存储的分类词库。本发明实施方式还公开了一种移动终端、云服务器、垃圾短信过滤系统。通过上述方式,本发明能够提高移动终端对垃圾短信的过滤效率,使垃圾短信的过滤具有个性化。
技术领域
本发明涉及文本分类领域,特别是涉及一种垃圾短信过滤方法、系统、移动终端以及云服务器。
背景技术
随着移动通信技术的飞速发展和手机普及率的迅速提升,短信正以其短小、迅速、简便、价格低廉等诸多优点日益成为人们的一种重要通信和交流方式,给用户带来了极大的交流方便,同时,垃圾短信日益猖獗,尤其是在智能手机快速普及、个人信息安全问题日益严峻的今天,不少用户都深受垃圾短信的困扰。垃圾短信是指用户没有定制过的,包含有广告、欺骗、色情等内容以及短时间内连续发送同样内容,影响用户正常使用、工作和生活的短信,常见的垃圾短信内容包括广告信息、色情信息、假中奖信息、欺诈信息、恶作剧等,即对用户没有价值的信息,给用户带来了很多的烦恼,因此急需对垃圾短信进行监控过滤。现有技术中主要包括两种垃圾短信的过滤方法:一种方法是在短信服务中心(SMSC)等短信处理中心进行处理;另一种方法则是在手机等移动终端上用编制的内嵌程序执行整个垃圾短信的过滤过程。
本申请发明人在长期研发中发现,有些信息例如彩票信息、票务信息、广告信息等对于一部分用户来说可能是垃圾短信,但对于另一部分用户来说则不属于垃圾短信,在短信服务中心进行过滤可能导致被错误分类的信息无法到达用户的移动终端上,垃圾短信的过滤缺乏考虑不同用户的需求差异;此外由于移动终端的计算速度和空间都比较有限,在移动终端上执行整个垃圾短信的过滤过程会消耗过多的时间与空间,影响用户对短信的正常接收。
发明内容
本发明主要解决的技术问题是提供一种垃圾短信过滤方法、系统、移动终端以及云服务器,能够提高移动终端对垃圾短信的过滤效率,使垃圾短信的过滤具有个性化。
为解决上述技术问题,本发明的第一方面是:提供一种垃圾短信过滤方法,包括:移动终端根据其存储的分类词库对待处理短信进行分类以获得分类结果,其中,分类结果为垃圾短信或非垃圾短信;当分类结果被判定为错误的分类结果且移动终端接收到对应错误的分类结果的上传指令时,移动终端将分类错误信息上传到云服务器以更新与移动终端对应的私有短信训练集,其中,分类错误信息包括待处理短信以及错误的分类结果;移动终端获得云服务器的词库更新信息以同步更新移动终端存储的分类词库,其中,词库更新信息为在云服务器存储的与移动终端对应的私有短信训练集和/或公有短信训练集更新后云服务器对私有短信训练集和公有短信训练集进行学习而获得。
其中,移动终端根据其存储的分类词库对待处理短信进行分类以获得分类结果的步骤具体包括:移动终端对待处理短信进行预处理以获得待处理短信对应的单词特征以及规则特征;移动终端将分类词库中存储的垃圾短信所占的比例P(C1)、非垃圾短信所占的比例P(C2)、单词特征以及规则特征在垃圾短信中的匹配概率P(xk|C1)以及非垃圾短信中的匹配概率P(xk|C2)代入贝叶斯分类公式中,以获得待处理短信属于垃圾短信的概率P(C1|X),贝叶斯分类公式具体如下所示:
移动终端获得待处理短信属于非垃圾短信的概率P(C2|X),具体如下所示:
P(C2|X)=1-P(C1|X)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京壹人壹本信息科技有限公司,未经北京壹人壹本信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310279728.8/2.html,转载请声明来源钻瓜专利网。