[发明专利]一种基于服务分析的高耦合移动应用识别方法在审
申请号: | 202210623575.3 | 申请日: | 2022-06-02 |
公开(公告)号: | CN115065983A | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 吴桦;王瑞;程光 | 申请(专利权)人: | 东南大学 |
主分类号: | H04W24/02 | 分类号: | H04W24/02;G06K9/62;G06N20/00;G06N20/10 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 服务 分析 耦合 移动 应用 识别 方法 | ||
本发明公开了一种基于服务分析的高耦合移动应用识别方法。在模型训练阶段,该方法首先捕获移动应用从启动开始运行几十秒的网络流量数据,并为网络流量数据打上标签;然后设置时间长度t,提取t秒网络流量数据中移动应用访问的服务信息作为属性,形成属性空间;接着,根据属性空间生成特征向量,将特征向量和应用标签组成样例;最后,利用有监督的机器学习算法训练分类模型,在训练模型的过程中对属性空间进行优化,得到最终的识别模型。在应用识别阶段,利用训练阶段得到的识别模型识别网络流量中的移动应用。本发明可以实现从多个高耦合移动应用中精准识别出每一个具体的高耦合移动应用,可以为互联网提供商为不同应用提供差异化服务提供前提。
技术领域
本发明涉及一种基于服务分析的高耦合移动应用识别方法,属于网络管理技术领域。
背景技术
随着互联网技术的快速发展,多样化的移动应用大大丰富了人们的生活。为了提高服务质量(QoS),互联网服务供应商更加重视对网络的监控和管理。他们希望通过了解用户对移动应用的使用情况来提高QoS。此外,早期识别应用是互联网服务供应商监测和管理其网络的前提条件。ISP可以在早期识别的基础上为不同的应用提供差异化的服务。
为了能够在移动应用启动后尽可能早的对移动应用进行识别,以前的方法是利用服务的IP地址和端口进行识别。在互联网发展的早期阶段,用户可以通过DNS解析或直接通过IP地址访问服务。此时,应用程序和IP地址之间的映射关系是一对一的。因此,应用程序可以通过其IP地址和端口号来识别。然而,随着用户访问量的进一步增加和对低访问延迟的需求,上述应用架构已不再适用。内容交付网络(CDN)加速和负载平衡技术的出现,解决了用户访问和访问延迟的问题,这也导致不同的IP地址被不同地区的同一应用所访问。当多个应用或服务被部署在一个服务器集群中时,IP地址和应用会是多对多的映射关系。此外,移动应用也可以使用动态或随机分配的端口。因此,通过IP地址和端口,或DNS解析和端口来识别移动应用已经不再可行。有实验表明,利用IP地址和DNS可以区分55%的流量,而单独的IP地址可以区分33%。
近年来,大多数研究都采用基于有效载荷的识别方法和基于统计特征的识别方法来准确识别应用程序。基于有效载荷的识别方法通常通过选择合适的有效载荷字节长度和提取关键流量特征来识别应用。基于统计特征的识别方法通常通过分析包级流量特征来识别移动应用。
然而,上述两种方法在识别具有类似流量特征的家族应用时存在识别精度低的问题。家庭应用是由一些应用提供商(如谷歌和Facebook)发布的一系列应用。为了方便于应用的开发,不同的应用会使用一些相同的公共服务,特别是同一公司的产品会使用该公司发布的更多公共服务。因此,使用相同服务的移动应用之间存在着服务耦合。服务耦合现象在家族应用中最为常见。然而,由于相同服务的流量特征往往相似,服务耦合是导致家庭应用分类模糊的根本原因。因此,通过提取有效的流量特征来区分家族应用是一个挑战。
此外,尽早识别应用是ISP提供更好的QoS的前提条件。为了满足不同移动应用的服务要求,ISP需要在移动应用启动后尽快对其进行识别,并为应用提供适当的服务。然而,由于基于有效载荷和基于统计特征的识别方法都需要大量的数据包。它们不能满足早期识别应用的要求。
发明内容
为了解决上述问题,本发明公开了一种基于服务分析的高耦合移动应用识别方法。在模型训练阶段,该方法首先捕获移动应用从启动开始运行几十秒的网络流量数据,并为网络流量数据打上标签;然后设置时间长度t,提取t秒网络流量数据中移动应用访问的服务信息作为属性,形成属性空间;接着,根据属性空间生成特征向量,将特征向量和应用标签组成样例;最后,利用有监督的机器学习算法训练分类模型,在训练模型的过程中对属性空间进行优化,得到最终的识别模型。在应用识别阶段,该方法首先提取t秒新传入网络流量中移动应用访问的服务信息;然后根据训练阶段优化的属性空间生成特征向量;最终用训练阶段得到的识别模型识别特征向量对应的移动应用。本发明提供的方法基于网络中到达的单向数据流。本发明可以实现从多个高耦合移动应用中精准识别出每一个具体的高耦合移动应用,可以为互联网提供商为不同应用提供差异化服务提供前提。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210623575.3/2.html,转载请声明来源钻瓜专利网。