[发明专利]一种关系抽取方法、计算机设备及程序产品在审
申请号: | 202210911110.8 | 申请日: | 2022-07-29 |
公开(公告)号: | CN115392219A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 宋彦;田元贺;李世鹏 | 申请(专利权)人: | 苏州思萃人工智能研究所有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/30;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 深圳市智享知识产权代理有限公司 44361 | 代理人: | 罗芬梅 |
地址: | 215000 江苏省苏州市相城*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关系 抽取 方法 计算机 设备 程序 产品 | ||
本发明涉及自然语言处理技术领域,特别涉及一种关系抽取方法,包括以下步骤:获取输入文本,并对输入文本进行编码,得到输出语句中每个词的隐向量;将输入文本进行处理,得到用于表征输入句子内部不同的词与词之间连接关系所占权重的注意力矩阵;将隐向量与注意力矩阵输入预设的神经网络,通过预设的第一算法计算得到整体向量;将整体向量进行分类转换处理,得到预测的关系类型。本发明还提供一种计算机设备和程序产品,动态利用了词图之间词与词的连接,提高了模型预测的性能。
技术领域
本发明涉及自然语言处理技术领域,其特别涉及一种关系抽取方法、计算机设备、可读存储介质及程序产品。
背景技术
关系抽取任务旨在从给定的句子和两个实体中,抽取(预测)这两个给定实体之间的关系。现有的研究大多会利用词与词之间的依存句法关系(dependency),构建词图(wordgraph),对词图编码,利用词图的信息提升模型的性能。然而,现有的方法需要依存句法分析工具获取词与词的依存句法关系,而这一过程往往成本高昂。同时,现有的方法未能动态利用词图之间词与词的连接,使得词图内潜在的噪音,影响性能。
发明内容
为了解决现有的技术问题,本发明提供一种关系抽取方法、计算机设备及程序产品。
本发明为解决上述技术问题,提供如下的技术方案:一种关系抽取方法,包括以下步骤:获取输入文本,并对所述输入文本进行编码,得到所述输入文本中每个词的隐向量;将所述输入文本进行处理,得到用于表征所述输入文本内部不同的词与词之间连接关系所占权重的注意力矩阵;将所述隐向量与所述注意力矩阵输入预设的神经网络,通过预设的第一算法计算得到整体向量;将所述整体向量进行分类转换处理,得到预测的关系类型。
优选地,将所述隐向量与所述注意力矩阵输入预设的神经网络,通过预设的第一算法计算得到整体向量包括以下步骤:对所述神经网络的最终输出使用MaxPooling算法计算得到第一实体向量表征、第二实体向量表征以及句子的向量表征;将所述第一实体向量表征、第二实体向量表以及句子的向量表征串联,得到所述整体向量。
优选地,所述神经网络包含多个处理层,所述隐向量作为输入,进入所述处理层,每一个所述处理层通过预设的第二算法计算得到的输出,都作为下一个所述处理层的输入,且所述注意力矩阵参与指导每一所述处理层的运算。
优选地,对所述输入文本进行处理得到注意力矩阵包括以下步骤:将所述输入文本转换为多个n元组,所述多个n元组之间按照所述输入文本的语序排列;基于所述n元组,在n元组的词与词之间创建连接,并基于所述连接得到最终词图;将所述最终词图转化为对应的邻接矩阵;将所述邻接矩阵通过预设的第三算法计算得到所述注意力矩阵。
优选地,将所述输入文本转换为多个n元组包含以下步骤:获取预设的n元组词表,通过所述词表匹配所述输入文本中其他的n元组。
优选地,基于所述连接得到最终词图包括以下步骤:基于所述n元组,在n元组内部的相邻词之间创建本地连接;在两个不同的n元组的首词与尾词之间两两创建全局连接;将所述本地连接与所述全局连接合并,得到所述最终词图。
优选地,创建所述全局连接的两个n元组之间包含的n元组个数不大于1。
优选地,将所述整体向量进行分类转换处理包含以下步骤:将所述整体向量进行分类转换处理包含以下步骤:将所述整体向量经过预设的全连接层后,送入预设的SoftMax分类器,得到所述预测的关系类型。
本发明为解决上述技术问题,提供又一技术方案如下:一种计算机设备,所述计算机设备包括处理器、存储器以及存储在所述存储器上的计算机程序,所述处理器执行上述计算机程序以上述方法的步骤。
本发明为解决上述技术问题,提供又一技术方案如下:一种计算机程序产品,包括计算机程序指令,所述计算机程序指令被执行时实现上述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思萃人工智能研究所有限公司,未经苏州思萃人工智能研究所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210911110.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:控制棒吸收体芯块及控制棒
- 下一篇:一种节能抗压光伏发电装置