[发明专利]基于NLP的漏洞描述信息与数据库表的实体映射方法在审
| 申请号: | 202011182308.4 | 申请日: | 2020-10-29 |
| 公开(公告)号: | CN112328805A | 公开(公告)日: | 2021-02-05 |
| 发明(设计)人: | 沈传宝;郝伟;李岩 | 申请(专利权)人: | 北京华云安信息技术有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/338;G06F16/335;G06F16/31 |
| 代理公司: | 北京华专卓海知识产权代理事务所(普通合伙) 11664 | 代理人: | 王一 |
| 地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 nlp 漏洞 描述 信息 数据库 实体 映射 方法 | ||
本公开的实施例提供了一种基于NLP的漏洞描述信息与数据库表的实体映射方法、装置、设备和计算机可读存储介质。所述方法包括对漏洞描述信息进行NLP关键词提取,获取关键词;根据知识图谱确定所述关键词的属性;根据所述关键词的属性及预先建立的数据库字典,建立所述关键词与数据库中的数据表的实体映射;根据所述实体映射对所述关键词的属性对应的数据表进行准确性和完整性验证;将验证结果展示给用户。以此方式,可以减少人工成本,减少错误率从而提高工作效率。
技术领域
本公开的实施例一般涉及数据处理领域,并且更具体地,涉及一种基于NLP的漏洞描述信息与数据库表的实体映射方法、装置、设备和计算机可读存储介质。
背景技术
随着网络安全领域研究水平的提高,与网络安全相关的文献越来越多,而网络安全领域中高杀伤力的“漏洞”可称之为安全领域的核武器,因此各个国家、组织及企事业单位都在积极的研究和收集漏洞信息。
自然语言处理(NLP)已经广泛应用于漏洞信息的识别中,相关漏洞实体也都相关技术能够实现,但是在漏洞信息管理的数据库领域,实现漏洞自然语义与数据库表之间信息的映射,仍需要人工完成。
从漏洞文本中挖掘并建立完整的漏洞信息库是一个长期且复杂的任务,目前针对漏洞信息挖掘在业内并未提出具有前瞻性的自动化实现技术,当前现有技术主要是基于规则的提取方法。但传统的基于规则方式存在着诸多缺陷,如:成本高、错率高、难去重等,该方法最大的问题比较死板,而且无法复用。每次有新的的数据输入和数据库库时,都需要重新进行人工干涉,开展相应的匹配工作。即使使用一些数据模板,也不可能穷尽所有的规则,因此该方法通用性较差,因此需要不断的人工维护规则信息,但随着信息的不断变化会导致规则数量的激增,最终将导致无法维护。
发明内容
根据本公开的实施例,提供了一种基于NLP的漏洞描述信息与数据库表的实体映射方案。
在本公开的第一方面,提供了一种基于NLP的漏洞描述信息与数据库表的实体映射方法。该方法包括:
对漏洞描述信息进行NLP关键词提取,获取关键词;
根据知识图谱确定所述关键词的属性;
根据所述关键词的属性及预先建立的数据库字典,建立所述关键词与数据库中的数据表的实体映射;
根据所述实体映射对所述关键词的属性对应的数据表进行准确性和完整性验证;
将验证结果进行展示。
进一步地,所述对所述漏洞描述信息进行NLP关键词提取包括:
通过预先建立的漏洞信息语料库对所述漏洞描述信息进行NLP分析,提取关键词。
进一步地,所述根据知识图谱确定所述关键词的属性包括:
所述知识图谱基于STIX2.0模型建立,用于描述所述关键词与所述关键词的属性的关系。
进一步地,所述关键词的属性包括公司、产品和/或漏洞信息。
进一步地,所述根据所述实体映射对所述关键词的属性对应的数据表进行准确性和完整性验证包括:
根据所述实体映射在所述关键词的属性对应的数据表中对所述关键词进行查找,对所述关键词的属性对应的数据表进行准确性和完整性验证。
进一步地,还包括:
接收用户的反馈信息,根据所述反馈信息更新所述知识图谱。。
在本公开的第二方面,提供了一种基于NLP的漏洞描述信息与数据库表的实体映射装置。该装置包括:
获取模块,用于对漏洞描述信息进行NLP关键词提取,获取关键词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华云安信息技术有限公司,未经北京华云安信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011182308.4/2.html,转载请声明来源钻瓜专利网。





