[发明专利]一种实体关系抽取方法、系统、设备及可读存储介质在审

专利信息
申请号: 202211027598.4 申请日: 2022-08-25
公开(公告)号: CN115600595A 公开(公告)日: 2023-01-13
发明(设计)人: 钱雪忠;江旭 申请(专利权)人: 江南大学
主分类号: G06F40/295 分类号: G06F40/295;G06F40/126;G06F40/30;G06F16/35;G06N3/04;G06N3/08
代理公司: 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 代理人: 陈华红子
地址: 214122 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 实体 关系 抽取 方法 系统 设备 可读 存储 介质
【说明书】:

发明涉及一种实体关系抽取方法、系统、设备及可读存储介质,包括:将待进行实体关系抽取的句子输入至word2vec网络中得到句子的特征输入向量,将所述特征输入向量输入至BiGRU网络中进行前向后向学习得到目标特征向量,利用多分支注意力机制计算目标特征向量权重值,采用softmax函数根据所述目标特征向量权重值计算句子中每个词被选作实体关系的概率,本发明提供的实体关系抽取方法将可以更好地处理实体特征表达,使句子特征信息在传递过程中保留句子前后的依赖信息,减少句子特征值在传递过程中的退化问题,更好地解决长期依赖和反向特征依赖传递问题,更好地识别实体与关系。

技术领域

本发明涉及自然语言处理技术领域,尤其是指一种实体关系抽取方法、系统、设备及可读存储介质。

背景技术

随着现代互联网的高速发展和人工智能及大数据在工业界的应用,随之产生了指数级的数据和海量信息,这些数据蕴含了许多有价值的信息,由于其中信息冗余多,信息量大,信息来源广泛以及信息结构多样性的原因,在这些无序的信息中如何挖掘这些高价值的信息变得越来越迫切,而信息抽取在挖掘信息方面变得越来越重要,它是从非结构化文本中提取结构化信息,而信息抽取中的关系抽取任务最为关键,因为它可以抽取出两个实体之间的关系。

关系抽取在自然语言处理中构建知识图谱等方面有着广泛的应用,知识图谱的初衷是让机器具备识别能力,推理能力,让它保存实体和实体相互连接的关系,构建其实体与关系的依赖路径。在工业界、学术界和日常生活中知识图谱被广泛应用,如在信息化推荐,问答系统,智能化搜索等方面。在智能化搜索方面通过输入文本即可得到相关问题的答案,例如现在的语音助手和聊天机器人;其次,在医学相关领域已经得到广泛的应用,例如根据症状智能寻找相似病例诊疗,可以做出更精确的治疗。关系抽取任务在生活中拥有重大的研究意义,可以极大的方便人们生活,减少生活中的繁琐事项,为生活提供智能与边界,因此对关系抽取在自然语言处理等方面被越来越多的研究者所研究,研究者通过对关系抽取性能的提升来提高关系抽取在信息化领域与工业界的医学界等应用范围。

现有的关系抽取方法通过卷积神经网络自动提取特征减少了大量的特征标记工作,节省了大量人力资源,但是由于卷积神经网络无法细化池化特征造成了语义信息的丢失;除此之外,还有人提出了递归神经网络模型在实体关系抽取中的应用,但其存在梯度消失和梯度爆炸的问题,且容易丢失长距离关系,难以处理长距离依赖问题。

综上所述,现有的关系抽取技术中存在语义信息丢失和长距离关系提取困难的问题。

发明内容

为此,本发明所要解决的技术问题在于克服现有技术中关系抽取时语义信息丢失以及长距离关系难以提取的问题。

为解决上述技术问题,本发明提供了一种实体关系抽取方法,包括:

将待进行实体关系抽取的句子输入训练好的实体关系抽取模型中,利用所述实体关系抽取模型中的word2vec网络提取句子的特征输入向量;

将所述句子的特征输入向量输入到所述实体关系抽取模型中的PCNN特征提取网络中提取句子的局部特征向量;

将所述句子的局部特征向量输入到所述实体关系抽取模型中的BiGRU神经网络中进行双向学习得到句子的目标特征向量;

将所述句子的目标特征向量输入所述实体关系抽取模型中的多分支注意力机制计算句子的目标特征向量权重值;

使用所述实体关系抽取模型中的softmax函数根据所述句子的目标特征向量权重值对句子的实体关系进行分类,得到句子中每个词被选作实体关系的概率。

在本发明的一个实施例中,所述利用所述实体关系抽取模型中的 word2vec网络提取句子的特征输入向量包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211027598.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top