[发明专利]一种垃圾短信识别方法及装置有效
申请号: | 201510065075.2 | 申请日: | 2015-02-06 |
公开(公告)号: | CN105992178B | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 粟栗;张峰;冉鹏;李元锋;周晶 | 申请(专利权)人: | 中国移动通信集团公司 |
主分类号: | H04W4/14 | 分类号: | H04W4/14;H04W12/12 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种垃圾短信识别方法及装置,该方法包括:根据设定的关键词,获取接收到的文本信息的关键词链向量、分片信息向量和独立子句匹配向量;基于预先建立的垃圾短信识别模型,拟合关键词链向量、分片信息向量和独立子句匹配向量,计算所述文本信息的近似度值;若所述近似度值大于设定阈值时,确定所述文本信息为垃圾短信,用以解决识别垃圾短信时,误判率较高,或识别垃圾短信时覆盖面较小,识别时容易丢失的问题。 | ||
搜索关键词: | 一种 垃圾 短信 识别 方法 装置 | ||
【主权项】:
1.一种垃圾短信识别方法,其特征在于,包括:根据设定的关键词,获取接收到的文本信息的关键词链向量、分片信息向量和独立子句匹配向量,所述关键词链向量是用于表征文本信息和设定的关键词之间的相似性和顺序性的特征向量,所述相似性是指文本信息中包含的关键词和设定的关键词之间的相似性,所述顺序性是指文本信息中包含的关键词形成的关键词链和设定的关键词形成的关键词链之间的顺序性;所述分片信息向量是用于表征文本信息和设定的关键词分片之间的包含关系和相似度的三维特征向量,所述关键词分片是设定的关键词之前或关键词之后的信息;所述独立子句匹配向量是用于表征文本信息中的独立子句的数量,独立子句是用于表征文本信息被包含的分片内容前或分片内容后增加的信息;基于预先建立的垃圾短信识别模型,拟合关键词链向量、分片信息向量和独立子句匹配向量,计算所述文本信息的近似度值;若所述近似度值大于设定阈值时,确定所述文本信息为垃圾短信。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司,未经中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510065075.2/,转载请声明来源钻瓜专利网。