[发明专利]基于t分布混合模型的网络多媒体业务半监督分类方法有效
申请号: | 201710077295.6 | 申请日: | 2017-02-14 |
公开(公告)号: | CN106878073B | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 董育宁;赵家杰 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;G06K9/62 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 李湘群 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分布 混合 模型 网络 多媒体 业务 监督 分类 方法 | ||
本发明公开了基于t分布混合模型的网络多媒体业务半监督分类方法,具体包含数据集预处理、t分布聚类过程和分类过程。数据集预处理采集互联网上各种多媒体业务的数据流样本,然后进行预处理操作。t分布聚类过程对上述网络数据流样本执行t分布混合模型或有限t分布混合模型的拟合工作,得到K个多维t分布聚类。分类过程对上述聚类后的结果进一步进行分类,并计算最后分类的总体正确率。本发明使用t分布混合模型对多媒体业务进行更加精确的拟合,提高了分类的准确度。有限t分布混合模型的EM算法有效地提高了t分布混合模型的收敛速度。实验表明提出的算法有较高的准确率,并且拟合的模型要优于传统的K‑means算法和传统的高斯混合模型的EM算法。
技术领域
本发明属于网络流量分类方法,具体涉及一种基于t分布混合模型的网络多媒体业务半监督分类方法。
背景技术
近年来,由于网络多媒体业务的不断发展,网络流量的监测管理和网络安全的难度也随之提升。对当前网络进行流量分类和分析能够帮助互联网服务提供商和相关网络管理人员了解当前网络状况,以保障网络的服务质量(QoS,Quality of Service)、提高计算机网络的性能。因此,网络流量分类成为当前计算机网络的研究热点。
流量分类主要可以分为四种:基于端口号的方式、深度包检测、基于统计的方式和基于行为和机器学习的方式。由于新的网络应用层出不穷,加密传输、动态端口号等技术的出现使得前两种方法对流量分类的准确率大为降低。而单独采用统计的方式只能从宏观角度对流量进行分析,不能规避一些无关的统计特征,导致计算量大。目前通常采用机器学习的方式进行流量分类。
关于流量识别的机器学习算法,主要分为有监督分类算法、无监督分类算法和半监督分类算法。半监督分类是有监督分类和无监督分类的结合。由于其结合了已知标签的样本,可以提前获取部分信息,所以被一些算法所采用。部分半监督网络流量分类的算法采用K-means及其改进算法进行分类;部分算法采用EM(Expectation Maximization)算法并使用高斯混合模型(GMM,Gaussian Mixture Model)进行拟合。但是受到数据样本的离群点的影响,这些算法的准确率都偏低。
发明内容
为克服以上算法的缺点,本发明使用t分布混合模型(TMM,t-distributionMixture Model)的EM算法对网络流量的数据样本进行拟合,并提出一种有限t分布混合模型(LTMM,Limited t-distribution Mixture Model),提高了TMM拟合时的收敛速度。实验结果表明,本发明对于多媒体网络业务的流量分类,总体正确率可达到97%以上,要优于传统的K-means算法和传统的高斯混合模型的EM算法。
为达到上述目的,本发明的技术方案为基于t分布混合模型的网络多媒体业务半监督分类方法,具体包含以下步骤:
(1)数据集预处理:采集互联网上各种多媒体业务的数据流样本,然后进行预处理操作;
(2)t分布聚类过程:对上述网络数据流样本执行t分布混合模型或有限t分布混合模型的拟合工作,得到K个多维t分布聚类;
(3)分类过程:对上述聚类后的结果进一步进行分类,并计算最后分类的总体正确率。
进一步,上述预处理操作具体包括:
(2.1)对数据流样本进行z-score标准化操作,使数据无量纲化;
(2.2)特征提取,又包括以下步骤:
(2.2.1)根据数据流样本,分别采用信息增益、信息增益率、一致性特征选择方式进行特征选择,提取出相应的特征组合;
(2.2.2)对这些特征组合分别进行后续的实验分析,确定算法对应的较好的特征选择方法,提取出有效的特征组合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710077295.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种报文传输方法和装置
- 下一篇:流量过滤方法及装置