[发明专利]一种知识图谱构建方法及装置、存储介质和计算设备在审

申请号：	202110947950.5	申请日：	2021-08-18
公开（公告）号：	CN113849658A	公开（公告）日：	2021-12-28
发明（设计）人：	吕洪燕;吴国平;张秀杰;刘电;莫春荣	申请（专利权）人：	广州国交润万交通信息有限公司
主分类号：	G06F16/36	分类号：	G06F16/36;G06F16/33;G06K9/62;G06N3/04
代理公司：	广州蓝晟专利代理事务所(普通合伙) 44452	代理人：	陈栩东
地址：	510000 广东省广州市天河区棠下***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种知识图谱构建方法装置存储介质计算设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种知识图谱构建方法，其特征在于，包括如下步骤：

S1、获取语料数据；

S2、将语料数据输入预训练模型，利用预训练模型生成语料数据对应的向量表示；

S3、将步骤S2生成的向量分别输入到LSTM网络和GRU网络，以提取语料特征，提取出的语料特征再通过Softmax多分类算法来进行实体抽取和实体关系分类；

S4、将步骤S3抽取出的实体以及实体间的关系存储到ElasticSearch数据库中，之后再从ElasticSearch数据库中搜索查找出所需的实体、实体间的关系，并进一步做编辑修改操作。

2.根据权利要求1所述的知识图谱构建方法，其特征在于，步骤S2生成的向量存储在Mysql中，编辑后的实体以及实体间的关系链存储在nebula graph图形数据库中。

3.根据权利要求1所述的知识图谱构建方法，其特征在于，从现有语料库、纯文本文件、HTML、XML、社区论坛爬取语料数据。

4.根据权利要求1所述的知识图谱构建方法，其特征在于，预训练模型采用RoBERTa预训练模型。

5.根据权利要求1所述的知识图谱构建方法，其特征在于，在步骤S3中，Softmax多分类算法将LSTM网络和GRU网络输出的语料特征均映射到(0,1)区间内，从而得到各语料特征所对应的概率，选出其中的最大概率，该最大概率所对应的实体或实体关系即作为抽取结果。

6.一种知识图谱构建装置，其特征在于，包括依次连接的语料数据获取模块、向量表示模块、实体抽取及实体关系分类模块、存储及编辑模块，其中，

语料数据获取模块，用于获取语料数据；

向量表示模块，用于将语料数据获取模块获取到的语料数据输入预训练模型，由预训练模型生成语料数据对应的向量表示；

实体抽取及实体关系分类模块，用于将向量表示模块生成的向量分别输入到LSTM网络和GRU网络来提取语料特征，提取出的语料特征再通过Softmax多分类算法来进行实体抽取和实体关系分类；

存储及编辑模块，用于将抽取出的实体以及实体间的关系存储到ElasticSearch数据库中，之后再从ElasticSearc数据库中搜索查找出所需的实体、实体间的关系并进行编辑修改。

7.一种计算机可读存储介质，存储有程序，其特征在于，所述程序被处理器执行时，实现权利要求1至5中任一项所述的知识图谱构建方法。

8.一种计算设备，包括处理器以及用于存储处理器可执行程序的存储器，其特征在于，所述处理器执行存储器存储的程序时，实现权利要求1至5中任一项所述的知识图谱构建方法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州国交润万交通信息有限公司，未经广州国交润万交通信息有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110947950.5/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载