[发明专利]一种互联网自治系统间商业关系的推断方法有效
申请号: | 202110245276.6 | 申请日: | 2021-03-05 |
公开(公告)号: | CN113111910B | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 李丹;王康;秦澜城 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00;H04L45/02;H04L67/01 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 罗文群 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 自治 系统 商业 关系 推断 方法 | ||
1.一种互联网自治系统间商业关系的推断方法,其特征在于,包括以下步骤:
(1)从互联网组织下载边界网关协议的原始数据,并对原始数据进行预处理,得到BGP路径,具体过程如下:
(1-1)从边界网关协议的原始数据中提取路径信息,从路径信息中删除因路由策略而导致的重复自治系统号,同时从路径信息中删除包含路由环路的异常路径,得到第一BGP路径;
(1-2)从互联网号码分配机构获取步骤(1-1)的第一BGP路径中自治系统号码分配记录,从该分配记录中删除未分配的自治系统号码和必须保留的自治系统号码,得到第二BGP路径;
(1-3)根据互联网上公开的第一层自治系统列表,当步骤(1-2)的第二BGP路径中的两个第一层自治系统之间被一个或多个非第一层自治系统隔开时,则删除该相应路径,得到第三BGP路径;
(1-4)从互联网交换中心获取互联网交换中心列表,根据中心列表,将步骤(1-3)的第三BGP路径上的已经出现在互联网交换中心列表中的自治系统号码删除,得到BGP路径;
(2)对步骤(1)预处理得到的BGP路径进行可靠商业关系推断,得到BGP路径中部分自治系统之间的可靠商业关系,包括以下步骤:
(2-1)从互联网路由注册表中获取自治系统的商业关系,根据商业关系,对步骤(1)的BGP路径上自治系统的商业关系进行标注,所述的商业关系为运营商客户关系、客户运营商关系或对等体关系;
(2-2)从互联网上获取第一层自治系统列表,将步骤(1)的BGP路径上任意两个第一层自治系统的商业关系标注为对等体关系;
(2-3)利用无谷原则,对BGP路径上自治系统的运营商客户关系进行标注,包括以下步骤:
(2-3-1)设一条BGP路径中的自治系统AS1、AS2、……、ASn-1、ASn、ASn+1……、ASm中包含了第一层自治系统,其中下标n、m为任意自治系统的号码,若ASn是BGP路径中的最后一个第一层自治系统,则根据无谷原则,得到AS1~ASn-1之间所有自治系统之间的商业关系为客户运营商关系,ASn+1~ASm之间所有自治系统之间的商业关系为运营商客户关系;
(2-3-2)设一条BGP路径中的自治系统AS1、AS2、……ASn、ASn+1……、ASm,其中包含了对等体关系,则将对等体关系之前的自治系统商业关系推断为客户运营商关系,之后的自治系统商业关系推断为运营商客户关系;
(2-3-3)设一条BGP路径中的自治系统AS1、AS2、……ASn、ASn+1……、ASm,其中没有一个自治系统属于第一层自治系统,或没有一个自治系统商业关系为对等体关系,但其中有一条链接ASn、ASn+1为运营商客户关系,则根据无谷原则,将ASn+1~ASm之间的所有链接推断为运营商客户关系;或其中有一条链接ASn、ASn+1为客户运营商关系,则根据无谷原则,将AS1到ASn之间的所有链接都推断为客户运营商关系;
(2-4)遍历步骤(1)的BGP路径,重复步骤(2-3-3)的操作,直至推断得到BGP路径中的所有运营商客户关系或客户运营商关系,完成遍历;
(2-5)多次从互联网组织下载边界网关协议的原始数据,并对原始数据进行预处理,重复上述步骤(2-1)到步骤(2-4)得到多个商业关系的推断结果,对多个商业关系的推断结果进行投票,即将多个商业关系的推断结果中的同一链接的推断结果相同,则将该推断得到的商业关系加入到该自治系统可靠商业关系中,重复上述过程,得到BGP路径中部分自治系统之间的可靠商业关系;
(3)将步骤(2)的自治系统可靠商业关系作为标签,利用机器学习方法训练模型,推断互联网自治系统间的不确定商业关系,包括以下步骤:
(3-1)将步骤(2)的BGP路径中部分自治系统之间的可靠商业关系作为带标签的链接样本LR,构建一个与链接相关的特征集,利用欧几里得距离作为链接之间距离的度量,计算BGP路径中商业关系不确定的自治系统链接到各个带标签样本之间的距离,选取与商业关系不确定的自治系统链接最近的k个带标签样本;将BGP路径中商业关系不确定的自治系统链接记为无标签数据集LU,将无标签数据集LU中与带标签样本的欧几里得距离最近的k个带标签样本记为Nk(i),利用下式,计算无标签数据集LU中每个不确定商业关系样本li属于每一类商业关系的概率
其中,n=0、1和2分别表示三种商业关系p2c、p2p和c2p;
(3-2)设定一个从均匀分布U[0,1]中采样得到的随机数αi,根据步骤(3-1)的概率利用下式,分别计算每个不确定自治系统商业关系的标签yi,得到一份不确定自治系统商业关系的标签:
其中,k为与商业关系不确定的自治系统链接最近的带标签样本数,i为无标签数据集LU中无标签数据的序号;
(3-3)多次重复步骤(3-2)生成多份不确定自治系统商业关系的标签;
(3-4)根据步骤(3-3)中的多份不确定自治系统商业关系的标签,用LjU表示多份不确定自治系统商业关系的标签中的第j份不确定自治系统商业关系的标签;
(3-5)采用XGboost模型作为基分类器,将步骤(3-4)的多个与步骤(2)的带标签的链接样本LR组合,对XGboost模型进行训练得到多个基分类器Modelj,利用Bagging方法,将多个基分类器Modelj集成为一个最终模型:
(3-6)将无标签数据集LU输入到步骤(3-5)的最终模型中,输出得到BGP路径中商业关系不确定的自治系统链接的商业关系,完成互联网自治系统间商业关系的推断。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110245276.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种区域消息共享方法及装置
- 下一篇:一种智能制造的矿井救援防坠落爬壁机器人