[发明专利]实体关系识别方法和装置、电子设备及存储介质在审

专利信息
申请号: 202310405543.0 申请日: 2023-04-12
公开(公告)号: CN116362252A 公开(公告)日: 2023-06-30
发明(设计)人: 陈焕坤;王伟;曾志贤;张黔;张兴 申请(专利权)人: 华润数字科技有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F40/216;G06F16/33;G06F16/35;G06N3/0455;G06N3/048
代理公司: 广州嘉权专利商标事务所有限公司 44205 代理人: 周翀
地址: 518000 广东省深圳市福田区梅林街*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 实体 关系 识别 方法 装置 电子设备 存储 介质
【说明书】:

本申请实施例提供了一种实体关系识别方法和装置、电子设备及存储介质,属于人工智能技术领域。该方法包括获取样本识别文本;根据编码器得到样本文本向量;根据解码器对头实体标记进行特征提取得到头标记向量;根据实体提取层对样本文本向量进行实体提取得到预测头实体;根据解码器得到尾标记向量;根据实体提取层对样本文本向量进行实体提取得到预测尾实体;根据关系预测层对预测头实体、预测尾实体进行实体关系提取得到预测实体关系;对原始实体关系识别模型进行调整,得到目标实体关系识别模型;根据目标实体关系识别模型对目标识别文本进行实体关系识别。本申请实施例能够减小搜索空间,提高解码速度,进而提高实体关系确定速度。

技术领域

本申请涉及人工智能技术领域,尤其涉及一种实体关系识别方法和装置、电子设备及存储介质。

背景技术

自然语言处理(natural language processing,NLP)中的信息抽取技术包括实体抽取和关系抽取等任务。实体抽取任务是指识别文本中具有特定意义的实体,如日期、地名等,关系抽取任务是指识别两个实体之间的关系。相关技术中,关系抽取任务根据模型的不同可划分为抽取式和生成式两类,其中,生成式的方法在解码过程中由于需要逐步迭代生成的目标文本,造成解码速度较慢,并且生成式方法的搜索空间为词表大小,而过大的搜索空间容易引起曝光偏差。因此,如何提供一种能够减小解码阶段的搜索空间,并提高解码速度,以提高实体关系确定速度的方法成了亟待解决的技术问题。

发明内容

本申请实施例的主要目的在于提出一种实体关系识别方法和装置、电子设备及存储介质,旨在减小搜索空间,提高解码速度,进而提高实体关系确定速度。

为实现上述目的,本申请实施例的第一方面提出了一种实体关系识别方法,所述方法包括:

获取样本识别文本,其中,所述样本识别文本包括样本头实体、样本尾实体,以及所述样本头实体与所述样本尾实体的样本实体关系;

将所述样本识别文本输入至预设的原始实体关系识别模型,其中,所述原始实体关系识别模型包括编码器、解码器、关系预测层、实体提取层;

根据所述编码器对所述样本识别文本进行特征提取,得到样本文本向量;

根据所述解码器对预设的头实体标记进行特征提取,得到头标记向量;

根据所述实体提取层、所述头标记向量对所述样本文本向量进行实体提取,得到预测头实体;

根据所述解码器对预设的尾实体标记、所述预测头实体、所述头实体标记进行特征提取,得到尾标记向量;

根据所述实体提取层、所述尾标记向量对所述样本文本向量进行实体提取,得到预测尾实体;

根据所述关系预测层对所述预测头实体、所述预测尾实体进行实体关系提取,得到预测实体关系;

根据所述样本头实体、所述样本实体关系、所述预测头实体、所述预测实体关系对所述原始实体关系识别模型进行参数调整,得到目标实体关系识别模型;

根据所述目标实体关系识别模型对获取到的目标识别文本进行实体关系识别。

在一些实施例,所述样本文本向量包括实体首位置向量和实体尾位置向量;

所述根据所述编码器对所述样本识别文本进行特征提取,样本文本向量,包括:

根据所述编码器对所述样本识别文本进行特征提取,得到初步文本向量;

根据预设的第一全连接层对所述初步文本向量进行实体首位置特征提取,得到所述实体首位置向量;

根据预设的第二全连接层对所述初步文本向量进行实体尾位置特征提取,得到所述实体尾位置向量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华润数字科技有限公司,未经华润数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310405543.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top