[发明专利]面向垃圾短信分类的离线模型改进与选择方法有效
申请号: | 201710409006.8 | 申请日: | 2017-06-02 |
公开(公告)号: | CN107256245B | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 毛莺池;齐海;贾必聪;李晓芳;平萍;徐淑芳 | 申请(专利权)人: | 河海大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 211100 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向垃圾短信分类的离线模型改进与选择方法,包括以下步骤:(1)特征选择与扩展,使用特征选择方法选择特征,构造特征词向量,使用特征词向量模型表示原始短信文本;(2)离线分类算法及改进的调优训练与测试,对离线分类算法作面向垃圾短信分类的改进,根据各离线分类算法及改进对步骤(1)所得的训练集和测试集进行数据准备,使用训练集对各离线算法及改进进行调优训练和测试;(3)基于评价指标的离线分类算法选择,提出面向垃圾短信分类的评价指标,使用该评价指标对步骤(2)所得到的测试结果进行分析并选择最优离线分类算法。 | ||
搜索关键词: | 面向 垃圾 短信 分类 离线 模型 改进 选择 方法 | ||
【主权项】:
一种面向垃圾短信分类的离线模型改进与选择方法,其特征在于,包括以下步骤:(1)特征选择与扩展,使用特征选择方法选择特征,构造特征词向量,使用特征词向量模型表示原始短信文本;(2)离线分类算法及改进的调优训练与测试,对离线分类算法作面向垃圾短信分类的改进,根据各离线分类算法及改进对步骤(1)所得的训练集和测试集进行数据准备,使用训练集对各离线算法及改进进行调优训练和测试;(3)基于评价指标的离线分类算法选择,提出面向垃圾短信分类的评价指标,使用该评价指标对步骤(2)所得到的测试结果进行分析并选择最优离线分类算法。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710409006.8/,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法和系统
- 下一篇:基于卷积神经网络的印花织物图像检索方法