[发明专利]消息分类方法和装置在审
申请号: | 201410850402.0 | 申请日: | 2014-12-30 |
公开(公告)号: | CN104615653A | 公开(公告)日: | 2015-05-13 |
发明(设计)人: | 秦秋平;龙飞;陈志军 | 申请(专利权)人: | 小米科技有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04W4/14;H04W12/12 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开是关于一种消息分类方法和装置,属于计算机技术领域。该方法包括:计算每个样本消息的特征值;按照特征值从大到小的顺序遍历,当第一样本消息的第一特征消息中正常样本消息所占比例大于第一预设阈值时,将第一样本消息的特征值作为第一分离阈值;按照特征值从小到大的顺序遍历,当第二样本消息的第二特征消息中垃圾样本消息所占比例大于第二预设阈值时,将第二样本消息的特征值作为第二分离阈值;将特征值大于第一分离阈值且小于第二分离阈值的样本消息作为下一层样本消息,重复执行上述步骤;基于得到的多层的第一分离阈值和第二分离阈值,对接收到的消息进行分类,得到分类结果。本公开提高了分类准确率。 | ||
搜索关键词: | 消息 分类 方法 装置 | ||
【主权项】:
一种消息分类方法,其特征在于,所述方法包括:计算每个样本消息的特征值,所述特征值用于表示相应的样本消息是垃圾消息的可能性大小,样本消息包括正常样本消息和垃圾样本消息;按照特征值从大到小的顺序遍历样本消息,对于当前遍历到的第一样本消息,将特征值小于所述第一样本消息的特征值的样本消息作为第一特征消息;当所述第一特征消息中正常样本消息所占的比例大于第一预设阈值时,将所述第一样本消息的特征值作为第一分离阈值,所述第一分离阈值用于划分出正常消息;按照特征值从小到大的顺序遍历样本消息,对于当前遍历到的第二样本消息,将特征值大于所述第二样本消息的特征值的样本消息作为第二特征消息;当所述第二特征消息中垃圾样本消息所占的比例大于第二预设阈值时,将所述第二样本消息的特征值作为第二分离阈值,所述第二分离阈值用于划分出垃圾消息;将特征值大于所述第一分离阈值且小于所述第二分离阈值的样本消息作为下一层样本消息,对下一层样本消息重复执行上述确定第一分离阈值和第二分离阈值的步骤,得到下一层的第一分离阈值和第二分离阈值,直至特征值大于当前层的第一分离阈值且小于当前层的第二分离阈值的样本消息的数目小于预设数目时停止,得到多层的第一分离阈值和第二分离阈值;基于所述多层的第一分离阈值和第二分离阈值,对接收到的消息进行分类,得到分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小米科技有限责任公司,未经小米科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410850402.0/,转载请声明来源钻瓜专利网。