[发明专利]模型训练方法、信息抽取方法及装置、电子设备、介质在审
| 申请号: | 202111676300.8 | 申请日: | 2021-12-31 |
| 公开(公告)号: | CN114297409A | 公开(公告)日: | 2022-04-08 |
| 发明(设计)人: | 樊乘源;刘海锋 | 申请(专利权)人: | 深圳市欢太科技有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
| 地址: | 518057 广东省深圳市南山区粤*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 信息 抽取 装置 电子设备 介质 | ||
1.一种模型训练方法,其特征在于,包括:
获取训练语料,并确定所述训练语料对应的三元组,以将所述三元组确定为训练数据;
根据所述训练数据训练多个神经网络模型,并通过所述多个神经网络模型对所述训练数据进行类型预测得到预测三元组;
对所述预测三元组的权重进行调整,并根据调整权重后的预测三元组更新训练数据;
根据更新后的训练数据对神经网络模型的模型参数进行调整,获取信息抽取模型。
2.根据权利要求1所述的模型训练方法,其特征在于,所述确定所述训练语料对应的三元组,包括:
根据目标关系类型将所述训练数据中的三元组确定为初始三元组,并根据所述训练数据的语义信息在所述初始三元组中确定待抽取三元组,以确定所述三元组。
3.根据权利要求1所述的模型训练方法,其特征在于,所述根据所述训练数据训练多个神经网络模型,包括:
根据所述训练数据得到多个训练数据子集;
将所述多个训练数据子集中的一个训练数据子集作为验证集,将剩余训练数据子集作为训练集,对多个神经网络模型进行训练。
4.根据权利要求3所述的模型训练方法,其特征在于,所述将所述多个训练数据子集中的一个训练数据子集作为验证集,将剩余训练数据子集作为训练集,对多个神经网络模型进行训练,包括:
将所述多个训练数据子集中的第i个训练数据子集作为验证集,将剩余训练数据子集作为训练集;
以第i个神经网络模型的验证集分数值最高为模型训练目标,对多个神经网络模型中的第i个神经网络模型进行训练,并确定训练好的第i个神经网络模型。
5.根据权利要求3所述的模型训练方法,其特征在于,所述通过所述多个神经网络模型对所述训练数据进行类型预测得到预测三元组,包括:
通过所述多个神经网络模型对所述训练数据进行预测,得到多个目标三元组的多个得分;
对所述目标三元组的多个得分进行平均处理获取每个目标三元组的目标得分,并根据所述目标得分确定所述预测三元组。
6.根据权利要求5所述的模型训练方法,其特征在于,所述根据所述目标得分确定所述预测三元组,包括:
若所述目标得分大于第一阈值,将所述三元组确定为候选三元组;
若所述目标得分小于第二阈值,或所述目标得分大于第一阈值且所述三元组未存在于所述训练数据对应的语义信息中,将所述三元组确定为待剔除三元组;其中,所述第一阈值大于所述第二阈值。
7.根据权利要求6所述的模型训练方法,其特征在于,所述对所述预测三元组的权重进行调整,并根据调整权重后的预测三元组更新训练数据,包括:
降低处于所述训练数据中的待剔除三元组的权重,增加所述训练数据之外的候选三元组的权重,并根据调整权重后的三元组更新训练数据。
8.根据权利要求6所述的模型训练方法,其特征在于,所述根据更新后的训练数据对神经网络模型的模型参数进行调整,获取信息抽取模型,包括:
调整候选三元组的函数权重,并调整待剔除三元组的函数权重;
根据所述候选三元组的函数权重以及所述待剔除三元组的函数权重对损失函数进行更新,确定目标损失函数;
以所述目标损失函数最小为训练目标,根据更新后的训练数据对神经网络模型的模型参数进行调整,以获取所述信息抽取模型。
9.根据权利要求8所述的模型训练方法,其特征在于,所述调整候选三元组的函数权重,并调整待剔除三元组的函数权重,包括:
根据指标参数确定所述候选三元组的函数权重,并根据分数阈值确定所述待剔除三元组的函数权重。
10.一种信息抽取方法,其特征在于,包括:
获取待处理语料;
通过信息抽取模型对所述待处理语料进行信息抽取,获取所述待处理语料对应的预测结果;其中,所述信息抽取模型根据权利要求1-9中任意一项所述的模型训练方法训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市欢太科技有限公司,未经深圳市欢太科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111676300.8/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





