[发明专利]一种电信运营商垃圾短信处理系统及处理方法有效
申请号: | 201210592920.8 | 申请日: | 2012-12-30 |
公开(公告)号: | CN103024746A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 吴及;吕萍;徐伟;沈明花;周正友;张磊 | 申请(专利权)人: | 清华大学;安徽科大讯飞信息科技股份有限公司 |
主分类号: | H04W12/12 | 分类号: | H04W12/12;G06F17/30 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 成金玉 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电信 运营商 垃圾 短信 处理 系统 方法 | ||
技术领域
根据12321网络不良与垃圾信息举报受理中心对其分类为:商业广告、色情、诈骗、病毒、政治敏感言论、其它。据12321调查,2012年上半年,我国手机短信息用户平均每周收到垃圾短信息10.6条。垃圾短信的数量有下降的趋势。2012年上半年用户对垃圾短信治理满意程度UFI仅达到31.5,但仍维持在较低水平。
2012年上半年中国手机短信状况调查报告显示,被调查的用户收到的垃圾短信息主要内容中,67.4%的用户收到过中奖类诈骗短信,而收到违法出售票据、证件类垃圾短信的用户达到48.9%,收到过冒充银行扣款类诈骗短信的用户为47.7%,收到房地产推销垃圾短信的用户,居第四位,为34.9%,收到零售业推销短信的用户比2011年下半年下降3.7个百分点,为31.2%。与2011年下半年相比,收到违法诈骗类信息的人数有增长的趋势。用户最反感的垃圾短信息第一位是“中奖类诈骗”,反感比例为33.5%,“违法出售票据、证件”比例达到15.3%,“冒充银行扣款类诈骗”为12.4%。总体来看,用户违法诈骗类信息的反感度远超于商业推广类信息,违法诈骗已经严重的危害到了用户的生活和工作。12321是举报中心,它公布的数据是从用户角度来看待垃圾短信的。从实际数据来看,商业推广类的垃圾短信数量是最大的,但是用户的反感程度并不是最大的。而诈骗类短信,仅从单条内容上不一定很容易判断。因此,在与电信运营商沟通过程中,初步确定垃圾短信处理策略。
垃圾短信的发送方式主要有从手机端发送和从平台接口端发送两类,以下讨论的只针对从手机端发送垃圾短信。从总体上看现行方法从作用范围上看可分为在运营商端进行处理和在用户手机端进行处理两类。下文从已发布的文献和公开的专利中,对现有垃圾短信处理情况进行了综述。
1.用户终端处理方法
在用户终端进行处理主要方式是由用户主动判断后将垃圾短信反馈回短信监控数据库,从而不断积累垃圾短信库,从而更好地在后续处理中发挥作用。
2.运营商端处理方法
运营商早期实施的垃圾短信处理的方法比较简单:黑白名单机制;内容关键词过滤机制。这两种方法的不足之处是:需要过多人工干预;准确率不高。
目前运营商端进行处理的手段主要分为两大类:基于单条短信的阻止机制和基于单个用户的阻止机制。
2.1单条短信处理
方法之一:考虑该短信所属发件人的所有短信中与该条短信内容相同的短信数量来判断该短信是否为垃圾短信。缺点主要是计算量较大且有延时。
方法之二:采用文本分类,大致分为特征构造、分类器训练以及分类器在线分类。至于分类器的选择,一般会采用1)垃圾邮件中广泛采用的贝叶斯;2)SVM分类器。当然也可采用神经网络、决策树。文本特征的选取对性能影响很大。
2.2单个用户处理
基于单个用户的阻止机制主要从用户的社会网络中进行分析,简单方法可考虑节点的出弧和入弧数,大体思想为若用户的短信的回复率很低且用户短信发送量大,则判为垃圾短信发送者。更为复杂方法需要考虑所有用户的通话网,再根据发送短信的用户与其所有短信接收者节点在通话网中的距离是否大于某一门限来判断该发送用户是否有嫌疑。
通过阅读文献和专利,可以看到现行的垃圾短信处理方法从作用时间上可以分成及时处理和延时处理;从作用对象上看可分为针对单条短信和针对某一发信人。具体方法如下表所示:
现行的处理垃圾短信都是从“及时处理”和“延时处理”、“单条短信”和“短信发件人”等多个角度进行处理,各种方法也是相互协同组成一个系统工作的。
综上所述,现有技术的缺点如下:
(1)及时处理情况下,没有结合延时处理,未能形成线上及时,线下统计分类。很容易导致,某个用户号码某天发送过垃圾短信后,之后所发的短信,全部定义为垃圾短信。或者带有垃圾信息的短信未及时处理。
(2)对于运营商垃圾短信分类未做系统化归类。
发明内容
本发明技术解决问题:克服现有技术的不足,提供一种电信运营商垃圾短信处理系统及处理方法,能够对海量垃圾短信进行细致分类,增强垃圾短信鉴定能力。
本发明技术解决方案:一种电信运营商垃圾短信处理系统,包括:线上及时处理内核子系统、线下数据挖掘子系统和数据库;所述数据库包括黑白名单库和短信模板库;
(1)线上及时处理内核子系统,包括简单规则匹配模块、短信预处理模块、快速模板匹配模块和分类处理模块;其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;安徽科大讯飞信息科技股份有限公司,未经清华大学;安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210592920.8/2.html,转载请声明来源钻瓜专利网。