[发明专利]一种VoIP网络流量所属平台的识别方法有效
申请号: | 202010394712.1 | 申请日: | 2020-05-11 |
公开(公告)号: | CN111641599B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 张震;刘发强;孙旭东;倪善金;褚洪岩;张之含;刘瑶 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;杭州东信北邮信息技术有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04M7/00;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 voip 网络流量 所属 平台 识别 方法 | ||
一种VoIP网络流量所属平台的识别方法,包括:根据流量特征从流量数据中过滤出VoIP流量,并根据五元组信息对VoIP流量进行拆分,生成新的流量文件;识别每个流量文件中的上下行流量,提取和计算上行、下行、合并流量的特征指标,并构成每个流量文件的特征向量;使用随机森林模型进行建模,构建VoIP平台识别模型,输入是由多个流量文件的特征向量构成的特征向量矩阵,输出是多个流量文件分别对应的VoIP平台标签;将待识别的多个流量文件的特征向量构成的特征向量矩阵输入至VoIP平台识别模型,并获得每个待识别的流量文件分别对应的VoIP平台标签。本发明属于信息技术领域,能有效识别加密后的VoIP流量及其平台归属。
技术领域
本发明一种VoIP网络流量所属平台的识别方法,属于信息技术领域。
背景技术
近年来,随着VoIP领域技术的长足发展,越来越多的通话业务由传统的电信网领域转移到VoIP,而技术的发现同样伴随着信息安全风险,以诈骗电话与政治有害类电话为代表的各类有害电话层出不穷,严重危害人民财产安全和社会稳定。现已发现当前网络流量中存在大量的有害话音,经由VoIP网关和互联网发起的非法VoIP呼叫已经成为重要渠道。由于组网灵活、资费低、难以溯源,VoIP已经成为境内外不法分子实施不法活动的重要手段。
为了迎合市场需求,部分VoIP服务提供商在公开协议基础上进行了修改并进行加密,使得VoIP流量不能被有效解析。而目前的VoIP流量识别方法也仅针对明文的SIP及H.323协议流量进行识别和检测。根据有关渠道反馈,目前市场上的加密VoIP平台已经占据市场的接近50%份额,而现有基于明文的VoIP流量识别方法仅能识别VOS话务中的不到1%,无法在平台采取加密配置的前提下有效识别VoIP流量及其平台归属。由此造成的信息安全隐患对于我国监管VoIP流量十分不利。
因此,如何有效识别加密后的VoIP流量及其平台归属,已经成为技术人员普遍关注的技术问题。
发明内容
有鉴于此,本发明的目的是提供一种VoIP网络流量所属平台的识别方法,能有效识别加密后的VoIP流量及其平台归属。
为了达到上述目的,本发明提供了一种VoIP网络流量所属平台的识别方法,包括有:
步骤一、根据流量特征,从流量数据中过滤出VoIP流量,并根据五元组信息对VoIP流量进行拆分,从而生成新的流量文件;
步骤二、识别每个流量文件中的上下行流量,提取和计算上行、下行、合并流量的特征指标,并由所有特征指标构成每个流量文件的特征向量;
步骤三、使用随机森林模型进行建模,构建VoIP平台识别模型,所述VoIP平台识别模型的输入是由多个流量文件的特征向量构成的特征向量矩阵,输出是多个流量文件分别对应的VoIP平台标签;
步骤四、将待识别的多个流量文件的特征向量构成的特征向量矩阵输入至VoIP平台识别模型,并获得每个待识别的流量文件分别对应的VoIP平台标签,
步骤三使用十折验证和网格搜索的方式进行模型参数的自动调优,调优参数包括但不限于:树数目、样本平衡方式、分叉标准、叶子最小样本数、分叉最小样本数,模型参数打分的方法为基于准确率、精准率、召回率、F1值、ROC曲线面积的打分体系,
对步骤三的VoIP平台识别模型进行训练,进一步包括有:
步骤31、读取由所有流量文件样本的特征向量构成的特征向量矩阵及每个流量文件样本对应的VoIP平台标签;
步骤32、打乱特征向量矩阵中样本行的排列顺序,随机抽取30%的样本作为测试集,其余作为训练集;
步骤33、将训练集随机划分为十份样本集,每份中的VoIP平台标签比例与全部训练集中的VoIP平台标签比例保持一致,并对十份样本集进行编号,设置j=1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;杭州东信北邮信息技术有限公司,未经国家计算机网络与信息安全管理中心;杭州东信北邮信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010394712.1/2.html,转载请声明来源钻瓜专利网。