[发明专利]模型训练方法、信息抽取方法及装置、电子设备、介质在审
| 申请号: | 202111676300.8 | 申请日: | 2021-12-31 |
| 公开(公告)号: | CN114297409A | 公开(公告)日: | 2022-04-08 |
| 发明(设计)人: | 樊乘源;刘海锋 | 申请(专利权)人: | 深圳市欢太科技有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
| 地址: | 518057 广东省深圳市南山区粤*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 信息 抽取 装置 电子设备 介质 | ||
本公开实施例是关于一种模型训练方法、信息抽取方法及装置、电子设备、存储介质,涉及计算机技术领域,该模型训练方法包括:获取训练语料,并确定所述训练语料对应的三元组,以将所述三元组确定为训练数据;根据所述训练数据训练多个神经网络模型,并通过所述多个神经网络模型对所述训练数据进行类型预测得到预测三元组;对所述预测三元组的权重进行调整,并根据调整权重后的预测三元组更新训练数据;根据更新后的训练数据对神经网络模型的模型参数进行调整,获取信息抽取模型。本公开的技术方案能够提高标注的精准度以及模型的准确性。
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种模型训练方法、模型训练装置、信息抽取方法、信息抽取装置、电子设备以及计算机可读存储介质。
背景技术
信息抽取是知识图谱构建中一项重要的技术,通过信息抽取,可以补全图谱中缺失的属性。
常见的信息抽取方案有两种,一种是基于抽取关系类型的信息抽取,通过预定义的抽取关系类型从图谱中抽取出三元组入库,通过训练模型从训练数据中抽取出三元组。另外一种是开放域信息抽取技术。其中为了解决标注效率低的问题,通常会采用远程监督的方案进行预标注。
上述方式中,基于抽取关系类型的信息抽取方式中由于远程监督而导致出现训练数据漏标和错标的问题,标注的结果不准确;训练数据的标注数量有限,存在一定的局限性;并且根据训练数据训练的信息抽取模型的准确性较低。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种模型训练方法、信息抽取方法及装置、电子设备、存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的训练数据不准确以及模型准确性较低的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种模型训练方法,包括:获取训练语料,并确定所述训练语料对应的三元组,以将所述三元组确定为训练数据;根据所述训练数据训练多个神经网络模型,并通过所述多个神经网络模型对所述训练数据进行类型预测得到预测三元组;对所述预测三元组的权重进行调整,并根据调整权重后的预测三元组更新训练数据;根据更新后的训练数据对神经网络模型的模型参数进行调整,获取信息抽取模型。
根据本公开的一个方面,提供一种信息抽取方法,包括:获取待处理语料;通过信息抽取模型对所述待处理语料进行信息抽取,获取所述待处理语料对应的预测结果;其中,所述信息抽取模型根据上述任意一项所述的模型训练方法训练得到。
根据本公开的一个方面,提供一种模型训练装置,包括:训练数据获取模块,用于获取训练语料,并确定所述训练语料对应的三元组,以将所述三元组确定为训练数据;预测模块,用于根据所述训练数据训练多个神经网络模型,并通过所述多个神经网络模型对所述训练数据进行类型预测得到预测三元组;权重调整模块,用于对所述预测三元组的权重进行调整,并根据调整权重后的预测三元组更新训练数据;模型参数调整模块,用于根据更新后的训练数据对神经网络模型的模型参数进行调整,获取信息抽取模型。
根据本公开的一个方面,提供一种信息抽取装置,包括:语料获取模块,用于获取待处理语料;结果确定模块,用于通过信息抽取模型对所述待处理语料进行信息抽取,获取所述待处理语料对应的预测结果;其中,所述信息抽取模型根据上述任意一项所述的模型训练方法训练得到。
根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的模型训练方法或上述任意一项所述的信息抽取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市欢太科技有限公司,未经深圳市欢太科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111676300.8/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





