[发明专利]一种基于被动DNS流量的递归域名服务器用户量估计方法在审
申请号: | 202110254552.5 | 申请日: | 2021-03-05 |
公开(公告)号: | CN112866039A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 朱宇佳;黄彩云;刘庆云;谭建龙;杨嵘;李钊;窦凤虎;杨威 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L29/12 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 李文涛 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 被动 dns 流量 递归 域名 服务器 用户 估计 方法 | ||
1.一种基于被动DNS流量的递归域名服务器用户量估计方法,其特征在于,包括以下步骤:
1)获取某个递归域名服务器RDNS发往其他域名服务器的DNS请求包,以及其他域名服务器发往RDNS的DNS响应包;
2)根据DNS请求包的目的IP地址和DNS响应包的源IP地址,区分经过和未经过RDNS缓存压缩的DNS请求包和DNS响应包;
3)解析经过和未经过RDNS缓存压缩的所有DNS请求包,提取DNS请求包时间戳和请求域名字段,根据时间戳统计每段时间内的域名及其出现次数,根据所述域名及其出现次数对所有DNS请求包进行聚类,得到类别个数,把类别个数作为RDNS的用户量估计值下界;
4)解析经过RDNS缓存压缩的DNS响应包,提取每个域名的请求时间戳和对应资源记录的TTL失效时间,统计每个域名在RDNS中的缓存更新间隔时间差序列,基于请求间隔时间差序列和缓存更新间隔时间差序列满足相似累计分布函数假设,得到RDNS内部用户针对每个域名的请求间隔时间差序列的累积分布函数及其参数;
5)根据经过RDNS缓存压缩的DNS请求包,生成模拟请求包的起始时间和终止时间,根据步骤4)得到的每个域名的请求间隔时间差序列的累积分布函数,随机生成满足终止时间范围内的每个域名的模拟请求包的请求间隔时间差序列,根据每个域名的模拟请求包的请求间隔时间差序列得到内部用户发往RDNS的模拟DNS请求包;
6)解析未经过RDNS缓存压缩的DNS请求包和步骤5)得到的模拟DNS请求包,提取请求包时间戳和请求域名字段,根据该时间戳统计每段时间内的域名及其出现次数,根据所述域名及其出现次数对未经过RDNS缓存压缩的DNS请求包和模拟DNS请求包进行聚类,得到类别个数,把类别个数作为RDNS的用户量估计值上界;
7)根据用户量估计值下界和用户量估计值上界,对使用RDNS的内部用户量进行估计。
2.如权利要求1所述的方法,其特征在于,步骤2)中根据DNS请求包的目的IP地址和DNS响应包的源IP地址是否在递归域名服务器的IP地址列表上,区分经过和未经过缓存压缩的DNS请求包和DNS响应包。
3.如权利要求1所述的方法,其特征在于,步骤4)中解析经过RDNS缓存压缩的DNS响应包,提取每个域名出现在DNS响应包的请求域名字段的开始时间戳和DNS响应包中域名对应解析结果资源记录的TTL存活时间,把开始时间戳加上TTL存活时间得到每个域名对应资源记录的TTL失效时间。
4.如权利要求1所述的方法,其特征在于,步骤4)中构建RDNS在每个域名上的模拟缓存,将每个域名从开始时间戳到TTL失效时间戳的每个时间区间作为一个缓存时间区间,每个模拟缓存时间区间含有一个缓存起始时间和缓存结束时间;将域名的一次缓存时间区间的缓存起始时间减去上一次缓存时间区间的缓存结束时间,得到一次缓存更新间隔时间差;计算域名的所有模拟缓存时间区间的缓存更新间隔时间差,按时间线排序得到缓存更新间隔时间差序列。
5.如权利要求1所述的方法,其特征在于,步骤4)中根据域名的缓存更新间隔时间差序列,估计每个域名的缓存更新间隔时间差序列的累计分布函数及其参数;根据请求间隔时间差序列与缓存更新间隔时间差序列满足相似累计分布函数假设,计算RDNS内部用户针对某个域名发起连续请求的请求间隔时间差序列的累积分布函数及其参数。
6.如权利要求5所述的方法,其特征在于,步骤4)中估计每个域名的缓存更新间隔时间差序列的累计分布函数及其参数的方法为:针对每个域名的缓存更新间隔时间差序列的累积分布函数满足的不同分布假设,采用最大期望估计算法分别估计不同的累积分布函数及其参数,或者基于每个域名的缓存更新间隔时间差序列的累积分布函数满足超指数分布函数参数,采用智能分量最大期望估计算法动态调整累积分布函数的超参数值,得到最合适的累积分布函数及其参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110254552.5/1.html,转载请声明来源钻瓜专利网。