[发明专利]基于知识图谱节点语义属性的图嵌入方法及系统在审
| 申请号: | 202210080718.0 | 申请日: | 2022-01-24 |
| 公开(公告)号: | CN114491070A | 公开(公告)日: | 2022-05-13 |
| 发明(设计)人: | 马智勇;肖政宏;夏琪;梁鑫宇;万殷鹏;陈逊瀚 | 申请(专利权)人: | 广东技术师范大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36 |
| 代理公司: | 佛山市禾才知识产权代理有限公司 44379 | 代理人: | 梁永健;朱培祺 |
| 地址: | 510635 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 知识 图谱 节点 语义 属性 嵌入 方法 系统 | ||
本发明涉及图嵌入技术领域,尤其是涉及基于知识图谱节点语义属性的图嵌入方法及系统,包括:采集购物商城的用户信息及产品信息,将获取到的文本信息进行格式处理后存储,并归档备份;以用户信息及产品信息作为节点,使用词嵌入的方法获取节点属性信息的语义特征向量;使用句子特征提取的方法对上述语义特征向量进行整理,组成一个句子的语义特征矩阵;基于语义特征向量和语义特征矩阵进行模型设计和搭建;根据模型预测连边,补全知识图谱;本发明充分利用了节点的属性信息,可以通过提取实体属性信息来预测这两个实体是否有关系,即通过获取知识图谱的head和tail的语义信息来预测relation,达到预测连边、补全知识图谱的效果。
技术领域
本发明涉及图嵌入技术领域,特别是基于知识图谱节点语义属性的图嵌入方法及系统。
背景技术
最近几年兴起的知识图谱,由于能迅速描述生活中的不同实体之间的相互关系,因此在信息搜索、电商等领域得到广泛的应用。知识图谱需要经历从无到有的过程,并不能一开始就得到完整的图,需要不断地获取新的知识,在使用时需要将其进行补全。在进行知识图谱补全时,由于图是由节点和边组成的,为了能够更好地解决图数据难以高效输入机器学习算法的问题,需要先将图数据进行图嵌入。
图嵌入是将属性图转换成向量或向量集,将图节点嵌入到一个低维连续空间内进行表示。一个良好的图嵌入可以有效地表示图结构,充分表示节点的信息,帮助节点之间的连边预测,进而帮助补全知识图谱,从而更好地将知识图谱应用到实际领域。
知识图谱通常由三元组(head,relation,tail)来表示,而现在的图嵌入模型都是用head向量和relation向量的和来预测tail向量,是将实体和关系嵌入到点向量空间中,但是实体和关系之间可能存在不确定性,head向量和relation向量很难准确预测出head和tail的关系,也存在没有充分使用到实体信息的缺陷。
发明内容
针对上述缺陷,本发明的目的在于提出基于知识图谱节点语义属性的图嵌入方法及系统,通过直接获取实体的语义信息来预测两个实体间的关系,可充分地利用节点的属性信息,有效地帮助知识图谱进行补全。
为达此目的,本发明采用以下技术方案:
基于知识图谱节点语义属性的图嵌入方法,包括如下步骤:
A.采集购物商城的用户信息及产品信息,将获取到的文本信息进行格式处理后存储,并归档备份;
B.以用户信息及产品信息作为节点,使用词嵌入的方法获取节点属性信息的语义特征向量;
C.使用句子特征提取的方法对上述语义特征向量进行整理,组成一个句子的语义特征矩阵;
D.基于语义特征向量和语义特征矩阵进行模型设计和搭建;
E.根据模型预测连边,补全知识图谱。
优选的,所述D步骤中模型设计和搭建包括如下内容:
d1.运用六个大小不同的卷积算子提取句子间词与词的关系,对应得到六个特征矩阵,并将六个特征矩阵连接;再经过最大池化操作,得到第一特征向量;
d2.将所述第一特征向量经过残差计算后得到第二特征向量,将第一特征向量与第二特征向量相加,得到第三特征向量;
d3.将第三特征向量进行粗粒度投影和细粒度投影,得到第四特征向量;
d4.应用三个大小相同的卷积算子对第四特征向量再次进行残差计算,得到第五特征向量;
d5.对第五特征向量进行随机失活和超平面投影。
优选的,所述d1步骤包括用户信息的操作,具体包括如下内容:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东技术师范大学,未经广东技术师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210080718.0/2.html,转载请声明来源钻瓜专利网。





