[发明专利]一种泛解析域名的识别方法、装置及电子设备有效
申请号: | 201810647448.0 | 申请日: | 2018-06-21 |
公开(公告)号: | CN108933846B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 李博;金炫臻;赵毅 | 申请(专利权)人: | 北京谷安天下科技有限公司 |
主分类号: | H04L29/12 | 分类号: | H04L29/12 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 祁献民 |
地址: | 100086 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 解析 域名 识别 方法 装置 电子设备 | ||
1.一种泛解析域名的识别方法,其特征在于,包括:
获取第一主域名的子域名的解析记录;
根据预定数据处理策略对所述第一主域名的子域名的解析记录进行第一数据处理;
从所述第一数据处理结果中提取4个指定参数对应的数据进行第二数据处理;
将第二数据处理结果代入指定机器学习模块,学习出第一指定参数对应的第一特征变量参数、第二指定参数对应的第二特征变量参数、第三指定参数对应的第三特征变量参数、第四指定参数对应的第四特征变量参数;
生成有效性计算模型并存储;所述有效性计算模型以所述第一至第四特征变量参数为参数,以第一至第四指定参数为变量;
根据所述有效性计算模型和预定判断策略判断待识别主域名的子域名的有效性;
其中,所述有效性计算模型为:Yk=w1·zk1+w2·zk2+w3·zk3+w4·zk4+w5;所述w1,w2,w3,w4,w5分别为第一至第五特征变量参数,所述第五特征变量参数为用于误差校正的参数;zkj为待识别主域名的第k个子域名的第j指定参数对应的标准化数据,Yk为待识别主域名的第k个子域名对应的有效性计算模型值,k=1,…,m,m为待识别主域名的子域名数量;k=1,2,3,4;
所述预定判断策略,包括:
对于第k个子域名,将其对应的有效性计算模型值代入神经元的非线性作用函数Sigmoid中计算得到第k个子域名对应的逻辑回归函数值;其中,所述Sigmoid函数表达式为
判断第k个子域名对应的逻辑回归函数值是否小于预定阈值;
若第k个子域名对应的逻辑回归函数值小于预定阈值,则确定第k个子域名为所述待识别主域名的有效子域名,若第k个子域名对应的逻辑回归函数值不小于预定阈值,则确定第k个子域名为所述待识别主域名的无效子域名。
2.根据权利要求1所述的泛解析域名的识别方法,其特征在于,每个子域名的解析记录包括:子域名及其对应主域名,子域名的解析数据,子域名的解析次数,子域名的首次解析时间,子域名的最后一次解析时间。
3.根据权利要求2所述的泛解析域名的识别方法,其特征在于,所述根据预定数据处理策略对所述第一主域名的子域名的解析记录进行第一数据处理,包括:
根据预定分类策略将第一主域名的每个子域名的解析记录的样本属性分为正样本或反样本;
从所述正、反样本中各抽取预定数量的子域名的解析记录;
对抽取的数据进行数据清洗得到第一清洗数据;
从第一清洗数据中以子域名的解析记录为单位按预设百分比随机提取出第一数据集;
根据所述第一数据集中各子域名的首次解析时间和子域名的最后一次解析时间计算各子域名的解析时长,并统计所述第一数据集中各子域名的解析数据在所述第一数据集中的出现次数作为相应子域名的解析数据的出现次数,计算所述第一数据集中各子域名的字符长度。
4.根据权利要求3所述的泛解析域名的识别方法,其特征在于,所述4个指定参数为:子域名的字符长度为第一指定参数,子域名的解析次数为第二指定参数,子域名的解析时长为第三指定参数,子域名的解析数据的出现次数为第四指定参数;
所述从所述第一数据处理结果中提取4个指定参数对应的数据进行第二数据处理,包括:
对所述第一数据处理结果中第一指定参数、第二指定参数、第三指定参数、第四指定参数对应的数据分别进行归一化;
对所述第一数据处理结果中第一指定参数、第二指定参数、第三指定参数、第四指定参数对应的归一化数据分别进行标准化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京谷安天下科技有限公司,未经北京谷安天下科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810647448.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种公网IP地址分配方法和装置
- 下一篇:一种地址快速分配的方法及装置