[发明专利]一种端到端的实体链接模型训练方法、实体链接方法及装置在审

专利信息
申请号: 202210154521.7 申请日: 2022-02-21
公开(公告)号: CN114707494A 公开(公告)日: 2022-07-05
发明(设计)人: 李劼;蒲仁杰;于艳华;丁琳萱;马昂 申请(专利权)人: 北京邮电大学
主分类号: G06F40/279 分类号: G06F40/279;G06F40/247;G06F40/211;G06F16/33;G06N3/08
代理公司: 北京金咨知识产权代理有限公司 11612 代理人: 薛海波
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 端到端 实体 链接 模型 训练 方法 装置
【说明书】:

发明提供一种端到端的实体链接模型训练方法、实体链接方法及装置,构建包含第一BERT模型、第二BERT模型和Global Pointer层的初始实体链接模型,基于第一BERT模型和Global Pointer层进行指称识别,基于第一BERT模型和第二BERT模型执行实体消歧。在模型的训练过程中,将指称识别和实体消歧两部分的损失函数进行联合,同时对初始实体链接模型用于执行指称识别和实体消歧的两部分参数进行反向传播调参,有效传递调节两部分误差,使其相互依赖,提升整体效果。在实体消歧的过程中,引入预设知识库作为外部知识,能够极大提升消歧效果。

技术领域

本发明涉及自然语言处理技术领域,尤其涉及一种端到端的实体链接模型训练方法、 实体链接方法及装置。

背景技术

由于自然语言表达的多样性,导致存在一词多义和多词同义的问题,实体链接技术正 是用于解决信息歧义问题的一种有效方法。目前实体链接的方法主要有两种:一种是实体 识别和实体消歧的两阶段方法进行实体链接。二是使用深度神经网络进行端到端的实体链 接。第一种技术将实体链接分为两个独立的阶段,第一阶段的结果作为第二阶段的输入; 第二种技术应用双向LSTM网络(双向长短时记忆网络)得到所有可能的指称,然后和所有候选实体计算相似度,相似度高于某个阈值即为预测结果。但是上述方法或多或少都存在各自问题,第一种方法将实体链接任务分为两个独立的阶段,没有利用两阶段之间的依赖关系,也使得第一阶段的误差不可修正地传递到第二阶段。而双向LSTM网络相比 预训练模型表达特征的能力有限,且十分依赖前任工作的成果。因此,亟需一种新的实体 链接方法。

发明内容

鉴于此,本发明实施例提供了一种端到端的实体链接模型训练方法、实体链接方法及 装置,以消除或改善现有技术中存在的一个或更多个缺陷,解决现有技术中实体识别和实 体消歧两阶段的误差相对独立无法传导修成导致的精确度不足的问题。

本发明的技术方案如下:

一方面,本发明提供一种端到端的实体链接模型训练方法,包括:

获取训练样本集,所述训练样本集中包含多个样本,每个样本为包含一个句子或多个 连续句子的段落,标记样本中的所有实体以及对应的描述信息作为标签;

获取预设知识库,所述预设知识库中记载有多个已知实体的描述信息,所述已知实体 包括一词多义以及多词同义的多种关系;

获取初始实体链接模型,所述初始实体链接模型包括第一BERT(BidirectionalEncoder Representations from Transformer)模型、第二BERT模型和Global Pointer层;所述第一 BERT模型与所述Global Pointer层连接用于执行指称识别,获取每个样本中的句子或段 落中的所有预测实体;所述第一BERT模型与所述第二BERT模型连接用于对所有预测实 体逐一进行实体消歧,其中,对于一指定预测实体,将第一BERT模型输出的全部作为第 一向量表示,将所述第一向量表示中与所述指定预测实体对应的部分作为实体向量表示, 将所述实体向量表示与所述第一向量表示加权求和得到整体向量表示;根据所述指定预测 实体检索所述预设知识库,找到与所述指定预测实体含义相同的一个正例以及含义不同的 两个负例,所述第二BERT模型对所述指定预测实体对应的正例及负例的描述信息分别进 行向量表示操作得到对应的第二向量表示;将所述整体向量表示分别与所述指定预测实体 对应的正例及负例的第二向量表示连接,并输入全连接层用于评分判断是否同义;

采用所述训练样本集对所述初始实体链接模型进行训练,其中,每个样本中的所有预 测实体逐一与各预测实体对应的所述预设知识库中的正例与负例进行实体消歧,计算联合 损失函数并反向传播,整体调节所述第一BERT模型、所述第二BERT模型和所述Global Pointer层的参数,得到目标实体链接模型。

在一些实施例中,所述预设知识库对所述已知实体配置存在一词多义或多词同义关系 的候选词。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210154521.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top