[发明专利]网络安全知识图谱的嵌入表示方法及装置有效
| 申请号: | 202010194889.7 | 申请日: | 2020-03-19 |
| 公开(公告)号: | CN113495963B | 公开(公告)日: | 2023-03-14 |
| 发明(设计)人: | 张佳敏;杨卫东 | 申请(专利权)人: | 复旦大学;珠海复旦创新研究院 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/34 |
| 代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 卢泓宇 |
| 地址: | 200433 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网络安全 知识 图谱 嵌入 表示 方法 装置 | ||
本发明提供一种网络安全知识图谱的嵌入表示方法及装置,其特征在于,包括如下步骤:网络安全数据预处理步骤,基于预先构建的网络安全知识图谱本体对网络安全数据进行整理形成结构化数据;网络安全数据集构建步骤,基于结构化数据对实体和关系进行索引标注,并计算附加信息作为训练权重,从而构建出含有训练权重的网络安全数据集;嵌入算法模型选取及配置步骤,选定需要进行对比实验的嵌入算法并输入配置参数从而形成一个训练任务;嵌入算法模型训练步骤,执行训练任务;嵌入算法模型测试步骤,基于嵌入表示结果进行链接预测;训练结果分析以及显示步骤,显示给用户查看从而让该用户分析确认。
技术领域
本发明属于知识图谱与知识嵌入领域,具体涉及一种集成多种嵌入算法针对网络安全实体与关系进行嵌入表示的方法及装置。
背景技术
知识图谱的概念是以语义网络为原型,近几年因为Google知识图谱的推出而被大众熟知。知识图谱可以看作是以网络或者图的形式构成的知识库,主要以“实体-关系-实体”的三元组形式组成。知识图谱本身可以作为一个百科类的知识库或者专业领域的信息库,在知识图谱的基础上可以结合自然语言处理等技术完成搜索和智能问答等应用。
当在知识图谱的基础上,需要进一步完成与语义计算或者推理等相关的功能时,网络形式的表示方式只能提供实体间的有无关系,无法体现实体间的语义相似性以及同一关系下的语义区别,例如有三元组(a,r,b)和(a,r,c),表示实体a与实体b、c均有关系,但是无法体现实体a与哪一个实体关系更加紧密。同时,大规模的知识图谱往往存在数据稀疏的问题,只依据有无关系来查找或者计算容易忽略较难到达的边缘信息。
因此应用嵌入表示(也称为知识表示学习)将实体与关系的语义信息表示为稠密低维向量,可以解决知识图谱原本实体与关系的“独热表示”带来的问题,例如信息独立、信息丢失等。嵌入表示的低维向量能够提高计算效率,有利于语义相似性计算,同时能够利用知识图谱中所有实体和关系信息,减少数据稀疏带来的影响。目前知识嵌入表示的模型有早期的SE模型,还有TransE、TransH、TransD为代表的翻译模型以及NTN等结合神经网络的模型。
为了网络安全知识图谱的基础上进一步利用网络安全数据特征以及知识图谱结构特征完成推理和搜索等扩展功能,需要结合知识嵌入算法来完成网络安全知识图谱的嵌入表示。
目前存在多种不同设计以及针对不同应用场景的嵌入算法,需要用户针对网络安全数据选取最合适的嵌入算法。然而,这些算法原本的实验结果只能作为参考,一是因为原算法使用的评价标准有所区别,无法横向比较不同类型的嵌入算法;二是因为网络安全数据属于专业领域数据集,经典的嵌入算法的实验均基于公共数据集。因此,用户需要通过大量的训练实验来进行对比分析,最终根据每一次的实验结果确认适合网络安全数据特征的最优嵌入算法,这些训练实验过程中用户每一次都需要分别对不同嵌入算法的训练进行设定以及配置,需要手动配置每一次训练,然后等待训练完成进行下一次配置,无疑会极大地耗费用户的时间以及精力,而且很容易出现错误。
发明内容
为解决上述问题,提供一种集成多种不同的嵌入算法从而完成网络安全数据的嵌入表示,并根据结果进行对比分析显示的嵌入表示方法,从而方便用户根据结果选取最优的嵌入表示模型和配置方式,本发明采用了如下技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学;珠海复旦创新研究院,未经复旦大学;珠海复旦创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010194889.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:检查飞单的方法、装置、电子设备及存储介质
- 下一篇:一种笼具智能夹持装置





