[发明专利]一种基于Transformer的实体关系联合抽取方法、介质及系统在审
| 申请号: | 202111480107.7 | 申请日: | 2021-12-06 |
| 公开(公告)号: | CN114398489A | 公开(公告)日: | 2022-04-26 |
| 发明(设计)人: | 张正;常光辉;黄海辉;胡新庭;陈浪 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红 |
| 地址: | 400065 重*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 transformer 实体 关系 联合 抽取 方法 介质 系统 | ||
1.一种基于Transformer的实体关系联合抽取方法,其特征在于,包括以下步骤:
获取互联网数据集,并对互联网数据集进行如下预处理,将数据集中的句子与对应的三元组用预设的标识符连接起来,并标注主实体、关系和副实体的开始位置和结束位置,并且涉及到多个三元组时需要预设的分隔符,同时训练数据需要预设的开始和结束标识符,处理后的数据如下;
将处理过后的数据集中的每个字进行向量化映射,同时通过每个字在句中的位置计算出位置向量,输入到基于Transformer的神经网络模型中,再通过反向传播算法进行训练,得到基于Transformer的实体关系联合抽取模型;
将需要进行实体关系抽取的句子输入到训练完成的基于Transformer的实体关系联合抽取模型中,预测出句子中的三元组。
2.根据权利要求1所述的一种基于Transformer的实体关系联合抽取方法,其特征在于,所述基于Transformer的神经网络模型的训练过程包括:
1)将输入句子中的每个词或字映射成对应的字向量;
2)在编码层,把训练样例中的每个字对应的字向量作为输入,采用Transformer编码器学习句子中每个字的上下文信息,同时得到表示向量Hl;
3)在通过分类器预测出训练样例中的主实体,其中通过二进制分类器,分别预测出训练样例中每个主实体的开始位置pstart和结束位置pend,以及主实体的向量表示
4)在解码层中,将编码器输出的表示向量Hl与二进制分类器预测出的主实体通过预设的方式拼接或者简单相加,得到新的上下文表示向量Ml,在对Ml进行解码,通过二进制分类器分类出副实体;
5)根据得到的标签的向量表示进行计算,得到主实体、关系和副实体分别所在的开始位置和结束位置;
6)选取所有样本的最大似然函数作为模型的目标函数;
7)通过反向传播算法训练模型,更新模型中所有的参数,最终得到收敛的实体关系联合抽取模型。
3.根据权利要求1或2所述的一种基于Transformer的实体关系联合抽取方法,其特征在于,所述根据训练集中的训练样例和三元组信息,使用特殊的标识符处理,其中,训练样例需要至少两种标识符,分别是开始标识符和结束标识符;该样例的三元组信息需要至少三种标识符,分别是开始标识符、分隔符和结束标识符;其中,三元组处理后的数据如下:
[SOS]h(1),r(1),t(1)[S2S_SEQ]
h(2),r(2),t(2)[S2S_SEQ]
...
h(n),r(n),t(n)[EOS]
其中h,r,t分别代表主实体,关系和副实体,[SOS],[S2S_SEQ],[EOS]分别表示三元组的开始标识符,三元组分隔符和三元组结束标识符。
4.根据权利要求2所述的一种基于Transformer的实体关系联合抽取方法,其特征在于,所述1)将输入句子中的每个词或字映射成对应的字向量,具体包括:
利用通过word2vec训练得到训练集的字向量表示,将输入训练样例中的每个字映射成对应的字向量,选取训练样例中长度最长的值为max_len,当句子长度小于max_len用特殊的占位符补充。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111480107.7/1.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法





