[发明专利]基于强化学习的IPv6活跃地址探测方法和装置有效
| 申请号: | 202110801982.4 | 申请日: | 2021-07-15 |
| 公开(公告)号: | CN113746947B | 公开(公告)日: | 2022-05-06 |
| 发明(设计)人: | 杨家海;宋光磊;何林;王之梁 | 申请(专利权)人: | 清华大学 |
| 主分类号: | H04L61/5046 | 分类号: | H04L61/5046;G06N20/00;G06K9/62;H04L101/659 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张梦瑶 |
| 地址: | 10008*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 强化 学习 ipv6 活跃 地址 探测 方法 装置 | ||
1.一种基于强化学习的IPv6活跃地址探测方法,其特征在于,包括以下步骤:
S1:获取IPv6种子地址,并确定所述种子地址的多个高密度区域;
S2:通过预先训练的多臂老虎机模型对每个所述高密度区域进行探测,包括:在每个所述高密度区域中生成预设数量的目标地址,并探测每个所述目标地址是否为活跃地址,通过以下公式计算所述目标地址的预设数量:
N(xi)=b*p(xi)
其中,
其中,N(xi)是任一高密度区域xi中生成的目标地址的数量,b表示每次迭代探测消耗的预算,p(xi)表示在所述任一高密度区域xi中生成目标地址的概率,Ri表示任一高密度区域xi的期望奖励,Vi表示所述任一高密度区域xi的地址空间维度,n表示所述任一高密度区域xi中预设的探测区域数值;
S3:确定所述预设数量的目标地址中的活跃地址数量和非活跃地址数量,并根据所述活跃地址数量和非活跃地址数量更新对应的高密度区域的期望奖励;
S4:重复执行步骤S2和步骤S3,以通过对每个所述高密度区域进行迭代探测,使所述种子地址的密度分布收敛到活跃地址的密度分布。
2.根据权利要求1所述的地址探测方法,其特征在于,通过密度空间树确定所述种子地址的多个高密度区域,其中,所述密度空间树的根节点表示活跃地址空间,所述密度空间树的叶节点表示所述种子地址的高密度区域,在步骤S4之后,还包括:
合并所述密度空间树的叶节点至对应的父节点。
3.根据权利要求2所述的地址探测方法,其特征在于,所述合并所述密度空间树的叶节点至对应的父节点,包括:对叶节点进行探测地址合并、奖励合并和空间合并,其中,通过以下公式进行所述空间合并:
其中,f.var_space是父节点的变量空间,xi.var_space是任一叶节点的变量空间,j是所述父节点对应的叶节点的数量。
4.根据权利要求1所述的地址探测方法,通过以下公式更新对应的高密度区域的期望奖励:
其中,表示第t+1次迭代后任一高密度区域xi的期望奖励,Beta表示Beta分布,表示第t次迭代后确定的任一高密度区域xi的活跃地址数量,表示第t次迭代后确定的任一高密度区域xi的非活跃地址数量,α*表示第t+1次迭代后新产生的活跃地址的数量,β*表示第t+1次迭代后新产生的非活动地址的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110801982.4/1.html,转载请声明来源钻瓜专利网。





