[发明专利]一种DGA域名的检测方法、系统及装置在审
| 申请号: | 202110087178.4 | 申请日: | 2021-01-22 |
| 公开(公告)号: | CN112929341A | 公开(公告)日: | 2021-06-08 |
| 发明(设计)人: | 刘卓龙 | 申请(专利权)人: | 网宿科技股份有限公司 |
| 主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L29/12 |
| 代理公司: | 北京华智则铭知识产权代理有限公司 11573 | 代理人: | 陈刚 |
| 地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 dga 域名 检测 方法 系统 装置 | ||
1.一种DGA域名的检测方法,其特征在于,所述方法包括:
获取域名白名单样本,并提取所述域名白名单样本的词嵌入特征;
将所述词嵌入特征编码为中间特征,并将所述中间特征解码为输出特征;
比较所述词嵌入特征和所述输出特征,并根据对比结果对编码和解码的过程进行校正,以通过校正后的编码和解码的过程,检测目标域名是否为DGA域名。
2.根据权利要求1所述的方法,其特征在于,提取所述域名白名单样本的词嵌入特征包括:
对所述域名白名单样本进行分词处理,并生成各个单词的词向量;
将所述各个单词的词向量形成的矩阵作为所述域名白名单样本的词嵌入特征。
3.根据权利要求1所述的方法,其特征在于,将所述词嵌入特征编码为中间特征,并将所述中间特征解码为输出特征包括:
将所述词嵌入特征依次输入第一神经网络和第二神经网络,其中,所述第一神经网络对所述词嵌入特征进行编码,以得到所述中间特征,所述第二神经网络将所述中间特征作为输入数据,并处理得到所述输出特征;
其中,所述第一神经网络和所述第二神经网络是互为镜像的神经网络。
4.根据权利要求3所述的方法,其特征在于,所述第一神经网络和所述第二神经网络均为卷积神经网络,其中,所述第一神经网络的层级结构与所述第二神经网络的层级结构相反;
或者
所述第一神经网络包括依次相连的卷积神经网络和长短期记忆神经网络,所述第二神经网络包括依次相连的长短期记忆神经网络和卷积神经网络;其中,所述第一神经网络与所述第二神经网络中的卷积神经网络的层级结构相反,并且第一神经网络与所述第二神经网络中的长短期记忆神经网络的层级结构相反。
5.根据权利要求1所述的方法,其特征在于,将所述词嵌入特征编码为中间特征包括:
识别所述词嵌入特征中各个单词的词向量,并提取各个所述词向量的特征向量,并将各个所述特征向量构成的矩阵作为编码得到的中间特征;
或者
将表征所述词嵌入特征的矩阵变换为更低维度的矩阵,并将所述更低维度的矩阵作为编码得到的中间特征。
6.根据权利要求5所述的方法,其特征在于,将所述中间特征解码为输出特征包括:
识别表征所述中间特征的矩阵中的各个特征向量,并将各个所述特征向量还原为对应的词向量,还原得到的词向量构成的矩阵作为解码得到的输出特征;或者
将表征所述中间特征的矩阵还原为更高维度的矩阵,并将还原得到的矩阵作为解码得到的输出特征。
7.根据权利要求1所述的方法,其特征在于,将所述词嵌入特征编码为中间特征包括:
识别所述词嵌入特征中各个单词的词向量,并提取各个所述词向量的特征向量,以生成由各个所述特征向量构成的特征矩阵;
按照各个单词在所述域名白名单样本中的排列顺序,提取所述特征矩阵的上下文逻辑特征,并将所述上下文逻辑特征作为编码得到的中间特征。
8.根据权利要求7所述的方法,其特征在于,将所述中间特征解码为输出特征包括:
将表征所述中间特征的上下文逻辑特征还原为符合所述排列顺序的特征矩阵,并将还原得到的所述特征矩阵中的各个特征向量转换为对应的词向量;
将转换得到的词向量构成的矩阵作为解码得到的输出特征。
9.根据权利要求1所述的方法,其特征在于,根据对比结果对编码和解码的过程进行校正包括:
计算所述词嵌入特征和所述输出特征之间的误差,并利用所述误差,对编码和解码过程中的参数进行调节,以使得所述词嵌入特征经过校正后的编码和解码的过程处理后,得到的输出特征与所述词嵌入特征相匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网宿科技股份有限公司,未经网宿科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110087178.4/1.html,转载请声明来源钻瓜专利网。





