[发明专利]应用识别方法和装置有效
申请号: | 201911153342.6 | 申请日: | 2019-11-22 |
公开(公告)号: | CN112839004B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 张昊迪;王帅;汪来富;王渭清;王海燚;刘东鑫;史国水;邓博仁;李诗旸;吴国威;金华敏 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | H04L69/22 | 分类号: | H04L69/22 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 赵倩男;刘剑波 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用 识别 方法 装置 | ||
1.一种应用识别方法,包括:
获取流量训练数据;
提取每个应用的特征;
根据每个应用的特征,对所述流量训练数据进行基于特征的分组,建立应用与特征的关联矩阵图,所述关联矩阵图中包括:每个特征在每个应用中出现的次数,以及每个特征在所述流量训练数据中出现的总次数;
提取待识别流量数据中的特征组合;
基于所述关联矩阵图,计算所述特征组合中每个特征,相对于每个关联应用出现的概率,将所述特征组合中每个特征,相对于每个关联应用出现的概率之和,作为所述特征组合相对于每个关联应用的特征分值;
根据所述特征分值,识别出所述待识别流量数据对应的应用。
2.根据权利要求1所述的应用识别方法,其中,计算所述特征组合相对于每个关联应用的特征分值还包括:
确定每个特征对应的权值指标,其中,所述每个特征对应的权值指标为相应的特征对应的应用个数的倒数;
根据每个特征对应的权值指标,计算所述特征组合相对于每个关联应用出现的加权概率和;
将所述加权概率和,作为所述特征组合相对于每个关联应用的特征分值。
3.根据权利要求1或2所述的应用识别方法,还包括:
将所述待识别流量数据,按照时间进行划分;
识别每个时间段内所述待识别流量数据对应的应用。
4.根据权利要求1所述的应用识别方法,其中,提取每个应用的特征包括以下步骤中的一种或多种:
根据流量训练数据进行协议解析,确定每个应用的特征;
基于应用商店提取每个应用的特征;
将每个应用的第三方流量作为对应应用的特征。
5.根据权利要求4所述的应用识别方法,其中,
将提取的特征在搜索引擎进行应用关联,去除所述特征中用户代理字段中的无效字段。
6.一种应用识别装置,包括:
关联矩阵图构建单元,被配置为获取流量训练数据,提取每个应用的特征,根据每个应用的特征,对所述流量训练数据进行基于特征的分组,建立应用与特征的关联矩阵图,所述关联矩阵图中包括:每个特征在每个应用中出现的次数,以及每个特征在所述流量训练数据中出现的总次数;
关联矩阵获取单元,被配置为获取应用与特征的关联矩阵图;
特征提取单元,被配置为提取待识别流量数据中的特征组合;
特征分值计算单元,被配置为基于所述关联矩阵图,计算所述特征组合中每个特征,相对于每个关联应用出现的概率,将所述特征组合中每个特征,相对于每个关联应用出现的概率之和,作为所述特征组合相对于每个关联应用的特征分值;
应用流量识别单元,被配置为根据所述特征分值,识别出所述待识别流量数据对应的应用。
7.一种应用识别装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行如权利要求1至5任一项所述的应用识别方法。
8.一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现权利要求1至5任一项所述的应用识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911153342.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可变透射率的汽车氛围灯
- 下一篇:真空管道流体膜悬浮车系统