[发明专利]一种运维知识图谱的生成方法及系统有效
申请号: | 201710417415.2 | 申请日: | 2017-06-06 |
公开(公告)号: | CN107368468B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 蔡禹;王晓佳;高峰;孔祥明 | 申请(专利权)人: | 广东广业开元科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/295;G06F16/36;G06F16/35;G06F16/9535;G06F16/25;G06N20/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉 |
地址: | 510623 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 生成 方法 系统 | ||
1.一种运维知识图谱的生成方法,其特征在于:包括以下步骤:
采用基于语义分析和机器学习的抽取方法对原始的运维知识数据源进行抽取,得到候选知识单元;
采用基于相关性和置信度的融合方法对候选知识单元进行知识融合,得到知识融合结果;
所述采用基于相关性和置信度的融合方法对候选知识单元进行知识融合,得到知识融合结果这一步骤,其包括:
以候选知识单元作为输入文本,对输入文本进行实体识别并生成候选实体;
对生成的候选实体进行实体相关性计算并构造相应的实体相关图,其中,实体相关图的顶点采用实体对象构造而成,实体相关图的边通过语言相关性权重计算后确定,所述语言相关性权重计算的公式为:
其中,ei和ej分别为候选实体中名词短语对(ei,ej)的2个名词短语,且ij,wij为ei和ej的语言相关性权重,GD(ei,ej)为ei和ej存在间接关系时的语言相关性权重,in(ei)和in(ej)分别表示知识库中与ei和ej所表示的候选实体存在指向关系的实体集合,log、max、min和∩分别为对数函数符号、取最大值运算符号、取最小值运算符号和交集符号,Kb为实体相关图的所有实体集合,|Kb|表示集合Kb中的元素个数;
根据构造的实体相关图进行候选实体顶点的置信度计算,得到候选实体顶点的置信度分数,所述候选实体顶点的置信度分数计算公式为:
其中,va为候选实体顶点,vb和vk均为实体相关图的实体顶点,Nh(va)和Nh(vb)分别为顶点va和顶点vb的邻域,α为阻尼因子,PR(va)和PR(vb)分别为va和vb的置信度分数,docSim(va)为顶点va所表示的候选实体与输入文本的上下文相似度,wba为实体相关图中边(va,vb)的权重,wbk为实体相关图中边(vb,vk)的权重;
进行候选实体与输入文本的语义相关性计算,所述候选实体顶点va与输入文本D的语义相关性SR(va,D)计算公式为:
其中,vk0为实体顶点,NmaxR为输入文本D中的每个实体指称项对应的候选集合中相关度最高的候选实体构成的子集,wak0为实体相关图中边(va,vk0)的权重,PR(vk0)为vk0的置信度分数;
根据置信度计算的结果和语义相关性计算的结果进行语义一致性计算,并根据语义一致性计算的结果得到知识融合结果,所述候选实体m与实体指称项ck0的语义一致性SCC(m,ck0)计算公式为:
其中,Vk0是与实体指称项ck0所有候选实体相对应的实体顶点构成的集合,vj表示实体顶点集合Vk0中第j个实体顶点;
对知识融合结果进行加工处理,得到运维知识图谱,所述运维知识图谱由运维知识实体和运维知识实体间的相互关系组成;
获取新的运维知识数据源来对运维知识图谱进行自适应更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东广业开元科技有限公司,未经广东广业开元科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710417415.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种视频标注方法
- 下一篇:一种越南语教学评分方法及其所应用的越南语学习平台