[发明专利]一种预训练模型知识图谱实体关系抽取方法及装置在审

专利信息
申请号: 202010029435.4 申请日: 2020-01-13
公开(公告)号: CN110825890A 公开(公告)日: 2020-02-21
发明(设计)人: 查文宇;张艳清;蓝科;王竞奇;王琳;殷腾蛟 申请(专利权)人: 成都四方伟业软件股份有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06N3/00;G06N20/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 610041 四川省*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 训练 模型 知识 图谱 实体 关系 抽取 方法 装置
【说明书】:

发明公开了一种预训练模型知识图谱实体关系抽取方法及装置,基于蚁群算法,蚁群算法的基本原理可以概括为以下步骤:1、蚂蚁在觅食的路径上会分泌一种信息素,能被后面的蚂蚁识别;2、在碰到还未走过的路时会随机选择路走,同时在新的路径也释放信息素;3、路径越长信息素的浓度就会越低,后面的蚂蚁在分叉路口时会选择信息素浓度最高的一条路;4、因此如此循环下去,最优路径上的信息素浓度会越来越高;5、最终蚁群找到最优的觅食途径。本方案基于上述思路通过建立指针路径模型来进行实体关系抽取。解决了现有的实体关系抽取算法采用的机制较为复杂,在进行训练时,计算量较大,计算周期较长,且无法进行并行训练的问题。

技术领域

本发明涉及机器学习领域,特别涉及一种预训练模型知识图谱实体关系抽取方法及装置。

背景技术

预训练可以较好的解决深度学习的一些缺点,例如深度学习的网络越深,需要学习的参数因此也越多,也因此需要更多的训练样本,不然小规模的样本容易造成网络的过拟合。同时深层神经网络有梯度扩散的问题,这会导致前面网络参数贡献将会很小,导致更新速度很慢。常用的预训练方法有逐层贪婪训练和无监督预训练(unsupervised pre-training)即训练网络的第一个隐藏层,再训练第二个…最后用这些训练好的网络参数值作为整体网络参数的初始值。经过预训练最终能得到比较好的局部最优解。

知识图谱主要目标是用来描述真实世界中存在的各种实体和概念,以及他们之间的强关系,我们用关系去描述两个实体之间的关联,例如姚明和火箭队之间的关系,他们的属性,我们就用“属性--值对”来刻画它的内在特性,比如说我们的人物,他有年龄、身高、体重属性。同时知识图谱可以通过人为构建与定义,去描述各种概念之间的弱关系,例如:“忘了订单号”和“找回订单号”之间的关系

实体是指具有可描述意义的单词或短语,通常可以是人名、地名、组织机构名、产品名称,或者在某个领域内具有一定含义的内容。实体是构建知识图谱的主要成员。

关系是指不同实体之间的相互的联系。实体与实体之间并不是相互独立的,往往存在一定的关联。例如“乔布斯”和“苹果”分别属于实体中的人名和产品名称,而它们是具有一定关系的。

在命名实体识别和关系抽取之后,需要对所产生的数据进行整合,三元组是能够描述整合后的最好方式。三元组是指(实体1,关系,实体2)组成的元组,在关系抽取任务中,对任意两个实体1和实体2进行关系抽取时,若两者具有关系,则它们可以构建成三元组。例如一句话“爱迪生发明了电灯泡”,可以构建的三元组为“爱迪生”,“发明”,“电灯泡”。

现有的实体关系抽取算法采用的机制较为复杂,在进行训练时,计算量较大,计算周期较长,且无法进行并行训练。

发明内容

本发明的目的在于:提供了一种预训练模型知识图谱实体关系抽取方法及装置,解决了现有的实体关系抽取算法采用的机制较为复杂,在进行训练时,计算量较大,计算周期较长,且无法进行并行训练的问题。

本发明采用的技术方案如下:

一种预训练模型知识图谱实体关系抽取方法,包括以下步骤:

S2、对语料数据进行实体识别;

S3、建立指针路径模型,表示t时刻指针k从实体i移动到实体j的概率;

S4、建立指针信息素释放模型,初始化指针参数后构建解空间;

S5、对语料数据进行迭代训练输出最优解。

蚁群算法的基本原理可以概括为以下步骤:

1、蚂蚁在觅食的路径上会分泌一种信息素,能被后面的蚂蚁识别;

2、在碰到还未走过的路时会随机选择路走,同时在新的路径也释放信息素;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都四方伟业软件股份有限公司,未经成都四方伟业软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010029435.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top